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智能 体 和 程序 体 的 对 话 

我 在 科学 网 上 第 一 次 看 到 张 军 平 教授 写 的 系列 文章 《 爱 犯 错 的 智能 体 》 
时 ， 我 还 以 为 这 里 “智能 体 ” 指 的 是 人 工 智 能 理论 或 编程 中 提 到 的 专业 名 
i] agent。 但 当 我 仔细 读 其 内 容 时 ， 特 别 是 在 从 头 浏览 其 内 容 时 ， 才 发 现 这 
里 的 智能 体 主要 指 的 是 人 ， 尤 其 是 生物 学 上 的 人 。 作 者 说 的 没有 错 ， 人 确 
实 易 犯错 误 。 书 中 从 分 析 生 物 人 的 感知 功能 谈 起 ， 以 生动 的 例子 介绍 了 人 
的 视觉 、 听 觉 、 触 觉 和 体 觉 的 相关 知识 及 其 基本 原理 。 之 后 又 进入 人 的 感 
情 世界 ， 从 人 的 情感 、 回 忆 、 梦 境 ， 一 直 谈 到 灵感 和 错觉 。 在 这 个 过 程 中 ， 
作者 又 适时 讨论 计算 机 在 处 理 人 的 感知 世界 时 会 遇 到 的 麻烦 及 处 理 原 则 ， 
甚至 还 不 忘 介绍 一 下 讨论 对 象 的 数学 背景 。 高 斯 、 黎 曼 、 莱 布 尼 茨 、 庞 加 莱 、 
爱 因 斯 坦 、 图 灵 等 大 师 级 人 物 的 名 字 频 频 出 现 。 作 者 不 费力 地 游 尺 于 生命 、 
计算 机 、 数 学 、 物 理 等 几 大 学 科 之 间 ， 让 读者 经 历 一 次 目不暇接 的 跨 学 科 
科学 旅游 。 再 加 上 一 个 个 有 趣 的 故事 ,还 有 诗 ， 画 ， 歌 ， 其 至 还 有 乡愁! 
以 这 样 的 方式 来 做 科普 ,我 还 是 第 一 次 读 到 ， 感 觉 很 新 鲜 、 很 解 恶 ， 又 易 
于 接受 。 

本 书 的 主角 是 被 称 作 “智能 体 ” 的 人 ， 和 暂时 称 之 为 人 智能 体 。 人 是 万 
物 之 灵 ， 却 也 不 能 避免 犯错 误 ,“ 人 非 圣 贤 ， 熟 能 无 过 ? ”。 作 者 为 何 用 一 
整 本 书 来 讨论 这 类 问题 呢 ? 看 来 除了 分 析 人 的 感知 和 认 知 功能 本 身 外 ， 作 
者 还 试图 用 人 智能 体 犯 的 错误 来 考核 另外 一 个 智能 体 ， 即 机 器 智能 体 ， 简 
称 程 序 体 。 如 果 后 者 遇 到 了 同样 的 问题 ， 它 能 避免 犯错 吗 ? 人 智能 体 犯错 
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误 一 般 有 客观 和 主观 两 方面 的 原因 。 客 观 原因 可 能 是 面临 复杂 的 环境 ， 包 
括 对 手 的 蓄意 欺骗 ， 主 观 原 因 则 往往 可 以 归结 为 经 验 不 足 或 经 验 有 偏差 。 
为 什么 会 把 美女 看 成 老 太 太 呢 ? 因为 不 知道 看 一 幅 画 可 以 从 多 个 角度 看 。 
为 什么 会 对 隐藏 在 背景 中 的 目标 物 视 而 不 见 呢 ? 因为 没有 想到 画 中 还 会 有 
画 。 一 个 正常 的 人 会 吃 一 珀 ， 长 一 智 ， 变 得 越 来 越 聪明 。 这 是 什么 ?这 就 
是 人 智能 体积 累 的 经 验 ， 以 及 从 经 验 中 提取 的 理性 认识 。 对 此 ， 程 序 体 有 
一 个 很 好 的 工具 一 一 贝 叶 斯 理论 。 犯 错误 好 比 一 个 结论 不 当 的 贝 叶 斯 推理 ， 
说 明 不 是 先 验 有 问题 ， 就 是 驱动 先 验 的 似 然 有 问题 。 一 个 有 丰富 先 验 和 可 
靠 选择 机 制 的 程序 体 就 不 大 会 犯 类 似 的 错误 。 所 以 人 智能 体 在 感到 困惑 的 
时 候 不 妨 咨询 一 下 程序 体 。 

把 贝 叶 斯 模型 比喻 为 人 智能 体 的 经 验 有 一 个 问题 , 就 是 程序 体 编写 的 
贝 叶 斯 模型 都 是 针对 有 限 前 提 的 , 即 它 只 在 程序 体 为 它 设 定 的 某 一 类 特定 
环境 有 效 ， 而 人 智能 体 则 以 它 的 全 部 生活 和 终身 经 历 为 其 经 验 支撑 。 试 问 
程序 体能 够 构造 出 这 样 的 贝 叶 斯 模型 来 吗 ? 这 可 能 就 是 程序 体 不 及 人 智能 
体 的 地 方 吧 。 不 过 贝 叶 斯 理论 至 今 仍 是 一 个 活跃 的 研究 领域 。 随 着 研究 者 
们 向 它 提出 的 问题 越 来 越 难 ， 要 求 越 来 越 苛刻 , 程序 体 也 在 一 步 步 赶 上 来 ， 
更 深刻 的 理论 和 技术 不 断 诞生 。2006 年 有 人 提出 了 结构 化 先 验 的 概念 , 力 
图 把 程序 体 中 贝 叶 斯 先 验 涉及 的 众多 概念 按 人 智能 体 的 认 知 结构 组 织 起 来 。 
先 验 不 再 局 限于 某 个 有 限 的 图 结构 ， 而 可 以 是 一 个 时 间 上 无 穷 的 随机 过 程 。 
更 进一步 ， 复旦 大 学 的 李斌 提出 了 可 学 习 先 验 的 思想 ， 直 接 挑 战 原本 属于 
人 智能 体 的 “ 活 到 老 ， 学 到 老 ” 概 念 。 

当然 教 益 还 不 止 这 一 点 。 人 智能 体 可 以 请 教程 序 体 的 地 方 还 很 多 。 例 
如 我 们 可 以 再 讨论 一 下 人 智能 体 对 隐藏 在 背景 中 的 目标 物 视而不见 的 问题 。 
这 次 我 们 考察 那 条 斑点 狗 。 公 正 地 说 ,斑点 狗 之 所 以 未 能 被 发 现 ， 是 因为 
组 成 斑点 狗 的 那些 斑点 是 一 个 离散 集合 ， 它 们 没有 连 成 线条 ， 并 且 与 其 他 


斑点 混杂 在 一 起 。 结 果 ， 本 来 是 “庞然大物 ”( 相对 于 该 图 像 ) 的 斑点 狗 消 
失 在 斑点 之 中 。 这 是 什么 问题 ? 这 是 知识 表示 粒度 的 问题 。 大 粒度 的 一 条 
狗 用 稀 玻 的 小 粒度 斑点 表示 ， 当 然 就 看 不 见 了 。 若 问 程序 体 这 个 问题 该 怎 
么 办 ? 程序 体 可 能 回答 : “你 怎么 不 用 粒度 计算 呀 ? ”正如 张 钱 院 士 指出 的 : 
“人 类 智能 的 一 个 公认 的 特点 ， 就 是 人 们 能 从 极 不 相同 的 粒度 上 观察 和 分 析 
同一 问题 。 人 们 不 仅 能 在 不 同 粒度 的 世界 上 进行 问题 的 求解 ， 而 且 能 够 很 
快 地 从 一 个 粒度 世界 调 到 另 一 个 粒度 世界 ， 往 返 自如 ， 毫 无 困难 。” 粒度 计 
算 ， 这 个 当年 扎 德 ( Zadeh ) 开辟 的 新 领域 ， 如 今 已 经 成 为 人 工 智 能 研究 者 
乐此不疲 的 探索 地 。 适 当地 调整 计算 的 粒度 ， 或 者 灵巧 地 处 理 大 、 小 粒度 
之 间 的 互动 ， 也 许可 以 让 那 只 隐藏 在 斑点 中 的 狗 露 出 原形 。 

我 们 再 看 看 本 书 中 所 说 的 视觉 自 举 原理 。 动 物 的 眼睛 在 差异 巨大 的 光 
强 变化 之 间 能 够 迅速 自我 调整 以 适应 多 变 的 外 来 光 。 我 原来 一 直 以 为 人 和 
猫 的 眼睛 在 光 强 变化 下 的 自 适应 原理 是 一 样 的。 感谢 本 书 作者 指出 这 两 者 
之 间 的 区 别 ， 使 我 增加 了 知识 。 书 中 也 提 到 了 光 强 的 瞬间 变化 对 交通 安全 
的 影响 。 这 个 问题 可 能 和 粒度 计算 有 关 ， 也 可 能 和 贝 叶 斯 先 验 有 关 。 但 无 
论 是 粒度 计算 或 贝 叶 斯 先 验 都 无 法 解决 它 ， 因 为 这 不 是 一 个 简单 的 光 强 调 
度 问 题 或 光 强 转化 问题 ， 而 是 人 智能 体 同 时 面 对 强 光 和 弱 光 ， 甚 至 还 有 微 
光 时 的 应 对 问题 。 试 想 ， 面 对 漆黑 的 夜晚 里 忽然 出 现 的 一 辆 开 着 远 光 类 的 
大 卡车 ， 你 还 能 看 清楚 一 只 莉 火 虫 吗 ? 幸好 ， 类 似 的 问题 计算 数学 家 们 早 
就 想到 了 。 有 一 门 学 问 叫 多 斥 度 计算 ， 就 是 为 解决 此 类 问题 而 诞生 的 。 这 
对 程序 体 是 个 好 消息 。 在 传统 计算 中 有 时 会 同时 出 现 极 大 的 数 ( 如 几 百 亿 ) 
和 极 小 的 数 ( 如 几 百 亿 分 之 一 )。 如 按 常规 方法 则 在 计算 进行 时 不 是 前 者 造 
成 溢出 ， 便 是 后 者 被 按 忽略 不 计 处 理 。 如 何 使 量 级 差异 巨大 的 数 能 够 恰当 
地 同时 处 理 , 这 是 多 尺度 计算 要 解决 的 难题 ,当然 , 数值 计算 和 光 强 调度 ( 物 
理 )、 光 强 感 知 (生物 物理 ) 之 间 并 没有 直接 联系 ， 这 只 是 一 个 类 比 。 但 也 
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许可 以 给 我 们 以 某 种 启发 。 

通过 这 些 例 子 或 更 多 的 例子 ， 我 们 可 以 看 到 ， 人 智能 体 和 程序 体 对 事 
物 的 认 知 和 处 理 能 力 实 际 上 是 互 有 短 长 的 。 本 书 作者 提 到 的 可 解释 性 问题 
是 一 个 极 好 的 例子 。 在 求解 各 种 实际 问题 时 ， 人 们 往往 希望 能 有 一 个 既 能 
通用 建 模 ， 又 能 提供 最 优 解 的 方法 ， 作 者 用 那 位 116 岁 的 老奶奶 做 比喻 说 
明 鱼 和 熊 掌 不 可 兼 得 ， 这 个 比喻 非常 贴切 。 回 想 在 可 计算 性 理论 中 我 们 学 
到 过 一 些 “ 不 可 计算 ”定理 ( 不可解 问题 的 男 一 种 说 法 )。 我 认为 116 岁 老 
奶奶 的 例子 给 出 了 不 可 计算 定理 的 一 种 如 新 版 本 :“ 通 用 建 模 和 最 优 求解 不 
可 同时 计算 定理 ”， 或 者 直接 称 为 “ 鱼 和 能 掌 不 可 兼 得 定理 "， 又 称 “ 平 猫 
不 确定 原理 "。 作 者 还 提 到 了 扎 德 在 40 多 年 前 提出 的 复杂 系统 “预测 和 可 
解释 性 不 相 容 原理 ”。 由 此 可 以 解释 深度 学 习 的 “最 优 求解 和 理性 解释 不 可 
兼 得 定理 "。 上 述 第 一 个 原理 说 了 一 个 数学 事实 ， 可 能 会 长 久 存在 下 去 。 第 
二 个 原理 则 可 能 是 受 我 们 目前 的 认识 能 力 所 限 ， 不 知道 将 来 有 没有 突破 的 
可 能 性 ， 至 少 在 某 种 意义 上 的 突破 。 

本 书 谈论 智能 。 虽 然 并 没有 正面 给 出 智能 或 人 工 智能 的 定义 ， 但 是 通 
过 很 多 生动 的 例子 ， 作 者 已 经 透露 了 对 于 此 类 问题 的 一 些 观点 。 读 者 可 能 
会 注意 到 ， 人 智能 体会 做 的 事情 很 多 ， 会 犯错 误 的 场合 也 很 多 ， 而 许多 常 
见 的 错误 却 没有 收入 书 中 。 例 如 棋 手 错 判 对 方 意图 ， 下 棋 输 了 ; 学 生 没有 
领会 题 意 ， 写 作文 跑题 了 ; 投资 者 错 佑 形势 ， 炒 股 大 亏 ， 等 等 。 为 什么 呢 ? 
我 认为 作者 表明 了 这 样 一 个 观点 。 人 智能 体 的 智能 并 不 局 限于 理性 思维 这 
样 的 高 级 形式 。 学 术 界 常用 的 公式 : 数据 一 信息 一 知识 一 智能 ( 或 智慧 ) 
只 是 程序 体 的 一 种 智能 公式 。 从 作者 罗列 的 大 量 视觉 、 听 觉 、 触 觉 、 体 觉 
的 实例 来 看 ， 该 公式 并 非 对 生物 人 智能 的 一 般 性 概括 。 如 果 注 意 到 视觉 、 
听觉 、 触 觉 、 体 觉 并 非 人 类 独 有 ， 则 它们 还 表明 了 人 以 外 的 生物 也 可 以 有 
智能 。 另 一 方面 ， 如 果 我 们 仔细 推 获 “体感 ”这 一 节 ， 可 以 发 现 本 书 并 不 
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认为 大 脑 是 生物 智能 的 唯一 产地 。 文 献 中 报道 的 著名 仿生 机 器 “大 狗 ” 能 
够 在 复杂 地 形 上 负重 快 跑 ， 它 对 身体 平衡 能 力 的 掌控 就 模拟 了 人 类 小 脑 的 
功能 ,在 更 广 的 意义 上 , 人 类 的 脑 是 一 个 复杂 结构 , 它 的 各 个 部 分 各 司 其 职 。 
例如 脑 干 要 负 起 维持 所 在 人 生命 的 多 种 重要 责任 ,包括 心跳 、 呼 吸 、 消 化 、 
体温 、 睡 眠 等 重要 生理 功能 。 还 有 许多 条 件 反射 和 无 条 件 反射 。 如 果 要 用 
人 工 智能 技术 构造 一 个 人 工 生命 ， 对 脑 干 功能 的 模拟 就 是 必 不 可 少 的 。 这 
令 我 们 想起 了 布 洛克 斯 主张 的 “没有 表示 的 智能 "。 他 赁 此 还 获得 了 1991 
年 国际 人 工 智能 联合 大 会 的 计算 机 与 思维 奖 。 

可 能 有 一 种 解释 是 : 脑 干 是 一 种 生命 现象 ， 它 却 与 智能 无 关 。 但 是 脑 
干 模拟 功能 是 人 工 生命 的 一 部 分 ， 它 与 人 工 智 能 有 关 。 这 种 解释 使 我 们 
意外 地 得 到 了 一 个 推论 : 人 工 智能 模拟 的 是 否 不 仅仅 是 智能 ， 而 可 能 也 泛 
指 某 种 生命 现象 ? 机 器 鱼 不 也 是 这 样 吗 ? 但 是 如 果 这 个 观点 能 够 成 立 的 
话 ， 就 会 产生 一 个 问题 : 它 是 否 管 得 太 宽 了 ? 人 工 智 能 究竟 是 我 们 努力 的 
目标 ?还 是 我 们 应 该 遵循 的 方法 学 ? 我 在 《人 工 智 能 》 一 书 的 前 言 中 曾 提 
到 学 界 对 于 人 工 智能 的 态度 有 轧 公 派 和 智 自 派 之 分 。 轧 公派 认为 总 有 一 天 
会 把 人 工 智能 这 座 大 山 完 全 搬 走 ( 到 那 时 机 器 像 人 一 样 聪明 )， 智 奥 派 则 认 
为 努力 挖 山 不 应 懈 仿 ， 但 控 尽 之 日 永远 不 会 来 到 。 我 愿意 站 在 智 投 派 一 边 ， 
认为 人 工 智能 既是 一 种 (无 止境 推进 的 ) 目标 , 更 是 一 种 ( 应 该 持之以恒 的 ) 
方法 学 。 

在 结束 序言 之 前 我 还 想 说 一 句 公 平话 。 本 书 名 日 《 爱 犯 错 的 智能 体 》 
人 智能 体 在 这 里 被 一 系列 的 故事 批 得 灰 头 土 脸 。 但 是 号 称 万 物 之 灵 的 人 智 
能 体 ， 其 智能 真 的 就 那么 不 堪 吗 ? 我 在 这 里 只 指出 一 点 ， 人 智能 体 固 然 爱 
犯错 ， 但 是 更 能 容错 。 为 什么 某 甲 能 够 一 眼 认 出 某 乙 ? 尽管 某 乙 外 表 已 与 
当年 初 见 时 很 不 一 样 。 为 什么 某 丙 能 解决 一 个 复杂 的 问题 ? 尽管 他 从 来 没 
有 遇 到 过 类 似 的 情况 。 为 什么 不 同 的 程序 体 被 设计 来 处 理 不 同 的 智能 问题 ? 


: 爱 犯 错 的 智能 体 


而 人 智能 体 却 能 够 处 理 各 种 各 样 的 智能 问题 ， 尽 管 他 只 有 一 个 大 脑 ， 其 结 
构 还 是 固定 的 。 所 有 这 些 和 他 们 的 容错 能 力 关 系 极 大 。 为 公平 起 见 ， 我 建 
议 作 者 在 本 书 出 版 后 再 写 一 本 《能 容错 的 智能 体 》 至 少 和 本 书 一 样 精彩 ， 
或 者 更 精彩 。 
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中 国 科学 院 数学 与 系统 科学 研究 院 
2019 年 3 月 于 北京 


“ 军 平 ， 我 觉得 你 不 妨 用 科普 的 形式 把 你 的 观点 写 出 来 ! ” 
看 完 我 写 的 技术 报告 ,我 的 博士 生 导 师 王 球 研 究 员 对 我 说 道 。 


1 萌芽 

那 是 2006 年 11 月 ,我 博士 已 毕业 3 年 ,小 朋友 刚 2 岁 , 每 天 抱 着 她 闲 和 逛 ， 
看 着 她 日 渐 成 长 ， 痛 并 快乐 着 。 她 虽 尚 不 能 流畅 交流 ， 但 我 相信 ， 多 跟 她 
说 些 话 ， 她 总 能 潜移默化 吸收 一 些 ， 也 许 对 她 今后 的 智力 发 育 会 有 大 的 帮 
助 。 出 于 天 生 的 好 奇 心 重 ， 我 也 顺便 观察 着 她 的 智力 发 育 变 化 ， 比 如 发 错 
音 的 问题 、 颜 色 辩 识 困 难 的 现象 ， 诸 如 此 类 。 那 段 时 间 ， 我 对 人 的 认 知 心 
理 也 有 些 兴 趣 ， 顺 便 看 了 点 皮 亚 杰 的 《儿童 发 展 心 理学 》、 华 生 的 《行为 主 
义 》 等 心理 学 方面 的 书籍 。 有 一 阵子 ， 经 常 为 自己 在 智能 发 育 方面 的 一 些 
奇 思 怪 想 激 动 不 已 。 为 了 能 方便 总 结 ， 我 向 陆 汝 铃 老师 申请 了 去 北京 的 中 
科 院 数学 所 访问 2 个 月 。 陆 老师 很 快 就 答应 
了 ， 并 将 中 科 院 计算 所 他 的 办 公 室 借 给 我 使 
用 。 在 那里 ， 我 完成 了 图 0.1 所 示 的 技术 报 
告 ， 还 见 到 了 就 在 隔壁 房间 办 公 ， 我 一 直 很 
仰 菜 的 人 工 智 能 老 前 辈 史 忠 植 老师 。 偶 尔 也 
会 去 隔壁 办 公 室 ， 跟 当时 正在 用 传统 机 器 学 
习 和 计算 机 视觉 方法 在 人 脸 识 别 领域 奋斗 着 
的 山 世 光 ， 以 及 在 生物 信息 学 领域 钻研 着 的 
A EVER. 图 01 最 初 的 技术 报告 一 一 

我 把 技术 报告 给 陆 老师 看 后 ， 他 说 还 科普 锥 形 


。” 爱 犯错 的 智能 体 


不 够 深入 。 王 环 老 师 也 说 ,缺乏 实验 在 计算 机 领域 是 站 不 住 脚 的 。 如 果 只 
是 想 表达 自己 的 观点 ,不 如 用 科普 的 形式 写 出 来 ， 就 像 厦门 大 学 的 集 禅 宗 、 
古琴 、 机 器 作曲 于 一 身 的 周 昌 乐 教授 写 的 《无 心 的 机 器 》 那 样 。 

仔细 想 了 想 ， 感 觉 工作 确实 也 不 是 太 完整 ， 不 如 放 一 放 ， 再 多 积累 点 ， 
多 看 看 世界 ， 也 许 会 更 丰满 。 


2 修身 

时 间 过 得 飞快 。2007 年 9 月 ， 我 去 加 州 大 学 圣迭戈 分 校 访问 了 半年 ， 
旁听 了 不 少 课程 和 报告 ， 如 提出 Adaboost 算法 的 约法 夫 ' 弗 洛 德 (Yoav 
Freund ) 的 “机 器 学 习 ” 课 ,也 听 到 杰 弗 里 希尔顿 ( Geoffrey Hinton ) 介 
绍 他 2006 年 发 表 在 Science 《科学 》) 上 ， 在 深度 玻 尔 效 曼 机 方面 的 研究 
进展 。 不 过 当时 ， 大 家 多 还 处 在 对 “深度 学 习 ” 将 信 将 疑 的 阶段 ， 毕 竞 第 
二 波 人 工 智 能 的 低潮 把 大 家 打击 坏 了 。 回 国 后 ， 我 继续 做 我 的 博士 研究 方 
向 一 一 基于 流 形 学 习 的 降 维 研究 。 我 们 小 组 针对 高 维 数据 降 维 后 如 何 做 统 
一 的 客观 评估 提出 了 一 套 准则 ， 也 基于 代数 拓扑 中 的 持续 同调 思想 ， 构 造 
了 主 单纯 复 形 的 监督 学 习 算法 。 在 远 距离 身份 识别 这 一 块 ， 基 于 人 可 以 根 
据 人 的 走路 轮廓 而 不 需要 对 图 像 进 行 细 粒 度 的 分 析 就 能 识别 行人 这 一 特点 ， 
提出 了 基于 时 间 不 变 的 步 态 模板 的 行人 识别 算法 。 

这 期 间 ， 我 也 为 人 工 智 能 两 个 主流 会 议 做 了 些 服 务 性 工作 ， 包括 给 
2013 年 在 北京 举行 的 “人 工 智能 国际 会 议 ”( JCAI ) 做 学 生 志愿 者 主席 ， 
以 及 2014 年 在 北京 举行 的 “机 器 学 习 国 际会 议 "( ICML ) 做 当地 组 委 会 成 员 。 
2013 年 11 月 的 第 一 个 周末 , 我 和 西安 电子 科技 大 学 高 新 波 教授 承办 了 “第 
十 一 届 中 国 机 器 学 习 及 其 应 用 研讨 会 "。 该 会 议 2002 年 始 于 复旦 ， 由 陆 汝 
铃 老 师 发 起 ，2005 年 转 至 南京 大 学 ， 在 王 廷 老师、 周志 华 教授 的 推动 下 ， 
成 为 国内 机 器 学 习 领 域 最 负 盛 名 的 研讨 会 。 通 过 参加 这 些 会 议 , 我 对 人 工 
智能 的 认识 也 深入 了 一 些 。 
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2014 4F 8 H —2015 4E 8 月 再 次 赴 美 国 访问 ， 并 被 宾夕法尼亚 州立 大 
学 聘 为 研究 助理 (Research Associate )， 在 信息 科学 技术 学 院 王 则 (James Z. 
Wang) 教授 的 指导 下 做 些 机 器 学 习 和 气象 预测 等 相关 的 研究 。 临 行 前 ， 特 
地 去 拜见 了 我 的 博士 导师 ， 他 又 给 我 讲 了 一 些 他 对 人 工 智能 发 展 近 况 的 思 
考 ， 并 给 我 建议 了 一 些 值得 关注 的 方向 。 而 我 到 美国 后 ， 也 利用 这 一 年 的 
时 间 ， 安 安静 静 地 思考 了 人 工 智能 的 发 展 与 不 足 。 

回国 后 ， 发 现 深 度 学 习 已 经 如 火 如 茶 ， 不 跟 进 几乎 很 难 在 预测 性 能 上 
占 得 优势 。 在 发 现 单 块 显 卡 处 理 能 力 的 问题 后 ， 我 们 便 开 始 陆续 购 入 了 更 
多 的 GPU ( 图形 处 理 器 ) 显卡 ,来 帮助 增加 计算 能 力 ， 目 前 已 经 有 了 22 
块 像样 的 显卡 。 对 我 来 说 ， 与 以 往 最 明显 的 区 别 ， 就 是 发 论文 的 成 本 高 了 ， 
这 让 人 多 少 有 些 心痛 。 以 前 一 支 粉笔 、 一 块 黑板 、 一 个 仿真 程序 可 能 解决 
的 事 ， 现 在 靠 大 数据 、GPU 、 硬 盘存 储 系统 ， 一 篇 论文 的 成 本 可 能 接近 10 
万 元 。 更 何况 ， 还 经 常会 碰 到 参数 调 了 半天 ， 算 法 不 收敛 的 状况 。 

2017 年 5 月 左右 ， 应 邀 去 西安 参加 了 两 次 郑 南宁 老师 主持 的 人 工 智能 
的 相关 研讨 会 ， 并 参与 筹备 中 国 自动 化 学 会 混合 智能 专 委 会 。7 月 ， 国 务 
院 发 布 了 《新 一 代 人 工 智 能 规划 》 其 中 谈 到 了 人 机 回路 。8 月 ， 混 合 智能 
专 委 会 成 立 ， 西 安 交 通 大 学 薛 建 儒 老 师 任 主任 ， 我 很 荣幸 当选 为 副 主任 之 
一 。 同 年 ,我们 开通 了 专 委 会 的 微 信 公众 号 。 

3 科普 

2018 年 上 半年 ， 机 缘 巧合 在 《科技 日 报 》 上 写 了 一 篇 关于 对 抗 生 成 网 
的 访谈 报道 。 想 着 要 给 大 众 读 ， 趣 味 性 就 得 加 强 一 点 。 所 以 ， 我 在 报道 中 
讲 了 两 个 小 故事 , 一 是 奥地利 小 说 家 斯 带 芬 ` 茨 威 格 写 于 1941 年 的 小 说 《 象 
棋 的 故事 》 里 ， 一 个 囚犯 在 监狱 里 自己 跟 自 己 下 国际 象棋 的 故事 ， 另 一 个 
是 金庸 的 《 射 雕 英雄 传 》 里 周伯通 被 困 桃 花鸟 后 的 双手 互 捕 。 虽 然 内 容 与 
对 抗 生 成 网 的 目的 有 一 定 的 出 入， 但 这 两 个 故事 都 比较 形象 地 讲述 了 同一 
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个 模型 里 存在 对 抗 的 事实 。 后 来 从 阅读 量 来 看 ， 反 响 还 不 错 。 

于 是 感觉 自己 可 以 尝试 写 点 科普 文章 。 刚 巧 专 委 会 也 需要 对 微 信 公众 
号 进行 宣传 ， 而 我 又 一 直 对 论文 成 本 上 升 太 快 、 经 费 有 点 撑 不 住 耿耿 于 怀 。 
某 天 在 “追寻 长 寿 之 道 ” 时 突然 发 觉 个 体 和 统计 的 差异 如 此 明显 ， 觉 得 这 
个 道理 似乎 能 解释 深度 学 习 的 优异 和 不 稳定 性 ， 便 给 专 委 会 微 信 公 众 号 连 
续 写 了 两 篇 文章 ,《 深 度 学 习 ， 你 就 是 那个 116 岁 的 长 寿 老奶奶 》 和 《童话 
(同化 ) 世界 的 人 工 智 能 》 科普 深度 学 习 之 现状 以 及 对 现在 产业 和 学 术 界 
带 来 的 同化 效应 。 在 文章 的 最 后 ， 我 留 了 个 尾巴 ， 我 认为 现在 的 研究 尚 不 
能 完全 解 开 智能 的 谜团 。 也 许 ， AR BEM ILA. 

这 两 篇 文章 的 反响 也 是 出 奇 的 大 ， 我 便 跟 我 博士 导师 的 好 朋友 、 对 我 
有 很 大 帮助 的 中 国 科学 院 自 动 化 所 的 王 飞跃 老师 在 微 信 上 说 了 这 件 事 。 开 
心 之 余 ， 他 建议 我 不 妨 写 个 科普 系列 。 

要 写 科普 系列 ,我 想起 了 2000—2003 年 在 北京 读 博 士 期 间 经 常 逛 北京 
大 学 校区 二 手书 摊 时 偶 得 的 一 本 科普 书 《 哥 德尔 ， 艾 舍 尔 ， 巴 赫 一 一 集 异 
壁 之 大 成 》 王 球 老 师 告 诉 我 这 是 本 好 书 ， 要 好 好 看 看 。 然 后 跟 我 讲 了 译 者 
之 一 、 严 勇 的 导师 、 北 京 大 学 马 希 文教 授 ( 也 是 周 昌 乐 的 导师 ) 的 一 些 轶 
事 ， 比 如 精通 六 国语 言 ， 对 此 书 在 信 达 雅 的 翻译 处 理 方 面 赞 叹 不 已 。2016 
年 ， 陆 汝 铃 老师 来 复旦 时 又 给 我 补充 了 一 些 对 马 希 文教 授 的 回忆 。 再 说 说 
这 本 书 ， 它 在 美国 一 直 是 本 科普 畅销 书 。 不 过 ， 不 足 在 于 ， 这 本 书 第 一 版 
发 行 的 时 间 是 1979 年 ， 正 处 在 人 工 智能 第 一 波 的 寒冬 中 ， 对 于 1979 年 以 
后 的 人 工 智 能 的 进展 、 观 点 变更 没有 涉及 。 其 次 ， 书 还 是 太 厚 了 。 真 心 有 
兴趣 把 这 本 书 细 细 读 完 的 ， 十 有 八 九 是 与 人 工 智 能 相关 的 科研 工作 者 或 从 
业 人 员 。 另 一 本 是 2015 年 我 在 美国 买 的 畅销 图 画 书 , 克 莱 夫 . 吉 福 德 ( Clive 
Gifford ) 撰写 的 Eve Benders: The Science of Seeing and Believing (人 《眼睛 
Oe: 看 和 相信 的 科学 》)， 书 中 讲 了 不 少 视 觉 错觉 的 例子 ， 但 并 没有 从 人 
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工 智能 的 角度 去 做 深入 分 析 。 

所 以 ， 我 想 结合 两 本 书 的 一 些 背景 知识 ， 再 加 上 我 2006 年 以 来 对 智能 
结构 发 育 的 一 些 认识 和 再 认识 ， 以 及 近年 来 对 人 工 智 能 的 许多 更 新 理念 来 
BUS. 

而 在 写作 手法 上 ， 我 希望 能 做 到 专业 和 引人入胜 。 俗 话说 ， 科 学 家 上 
报纸 ， 就 会 少 一 圈 朋 友 ; 科学 家 上 电视 ， 就 没有 朋友 了 。 所 以 ， 写 的 内 容 
我 都 反复 黄 酌 过 ， 确 保 逻 辑 通 畅 、 无 漏洞 ， 防 止 没 朋 友 。 但 人 不 是 神 ， 总 
有 可 能 会 出 错 。 如 果 仍 有 遗漏 和 问题 ， 后 面 我 会 做 个 勘误 表 。 而 关于 如 何 
引人入胜 ， 我 采用 了 与 我 所 读 过 的 科普 书 不 太一 样 的 风格 ， 即 小 故事 加 严 
肃 科普 的 形式 ， 偶 尔 会 穿插 几 个 科学 笑话 ， 当 然 还 要 有 点 中 国 特色 ， 这 个 
风格 基本 贯穿 了 全 书 。 

不 过 ， 万 事 开 头 难 。 虽 然 每 一 节 要 写 的 基本 路 线 我 都 清楚 ， 但 怎么 开 
头 都 挺 头 痛 的 。 所 以 ， 我 想 了 一 些 办 法 。 比 如 跑 跑 步 、 罗 远 狗 ， 期 望 缓解 
之 余 还 能 释放 点 多 巴 胺 来 启发 一 下 ， 一 有 好 的 点 子 就 赶紧 记 下 。 当 然 ， 还 
得 有 充足 的 时 间 投入 。 所 以 ， 在 完成 这 个 系列 的 过 程 中 ,我 把 很 多 朋友 的 
讲座 邀请 、 登 门 讨论 都 无 情 地 拒绝 了 。 没 办 法 ， 有 时 候 创作 和 研究 都 需要 
一 个 人 有 不 间断 的 独立 思考 时 间 。 这 应 该 就 是 做 科研 要 有 的 狂热 吧 。 另 外 ， 
有 的 时 候 短 时 间 高 强度 的 集中 思考 ， 确 实 能 促进 思维 、 帮 助人 更 深入 细致 
地 思索 问题 的 可 能 答案 。 虽 然 这 段 时 间 平 均 每 天 睡眠 约 5 个 半 小 时 ， 确 实 
很 累 ， 每 当 想 放 弃 时 ， 我 就 会 想起 美国 作家 罗伯特 ' 卡 尼 格 尔 写 的 《 知 无 
涯 者 : 拉 马 努 金 传 》 中 描述 过 的 印度 数学 家 拉 马 努 金 追求 数学 真理 的 过 程 ， 
就 会 想起 因 玻 尔 兹 曼 方程 和 朗 道 阻尼 的 工作 而 于 2010 年 获得 “数学 界 的 诺 
贝尔 奖 ” 菲 尔 效 奖 、 主 攻 最 优 和 输 运 理论 的 塞 德里 克 “' 维 拉 尼 (Cédric 
Villani ) 在 其 书 《一 个 定理 的 诞生 : 我 与 菲 尔 茨 奖 的 一 千 个 日 夜 》 中 提 到 的 
坚持 和 努力 。 也 会 想起 近代 著名 学 者 王国 维 在 《人 间 词 话 》 中 提 及 的 古今 
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成 大 事业 、 大 学 问 者 必 经 之 三 重 境界 : 

1. 昨夜 西风 凋 采 树 。 独 上 高 楼 ， 望 尽 天 涯 路 。 一 一 北宋 胺 殊 《 蝶 
ASHE + 槛 菊 愁 烟 兰 泣 露 》 

2. 衣 带 渐 宽 终 不 悔 ， 为 伊 消 得 人 惟 翌 。 一 一 北宋 柳 永 《 蝶 恋 花 : 位 倚 
危楼 风 细 细 》 

3. 众 里 寻 他 千百度 。 莫 然 回首 ， 那 人 却 在 ， 灯 火 阑珊 处 。 一 一 南宋 辛 
FR CHER + 元 夕 》 

总 之 ， 写 这 个 系列 对 我 来 说 ， 是 物 超 所 值 的， 因为 在 科普 的 同时 ， 我 
也 在 其 中 总 结 了 不 少 我 对 人 工 智能 诸多 问题 的 观点 和 探讨 ， 希 望 能 给 那些 
对 人 工 智能 感 兴趣 的 人 有 所 启发 。 

最 后 感谢 中 国 自 动 化 学 会 混合 智能 专 委 会 薛 建 侍 主 任 、 陈 德 旺 副 主任 、 
王 晓 师 妹 对 本 科普 系列 在 微 信 公 众 号 传播 的 大 力 支 持 ， 感谢 科学 网 连续 20 
余 次 推荐 本 科普 系列 文章 至 科学 网 头条 ， 也 感谢 众多 微 信 公众 号 如 中 国 工 
程 院 院 刊 、 中 国 自 动 化 学 会 等 的 推荐 。 这 些 支持 ， 让 更 多 对 人 工 智 能 感 兴 
趣 的 人 了 解 了 这 个 科普 系列 的 工作 。 另 外 ， 我 也 衷心 感谢 很 多 朋友 在 本 书 
冉 写 中 提出 的 宝贵 意见 ， 尤 其 是 与 我 一 同 从 2002 年 “第 一 届 中 国 机 器 学 习 
及 其 应 用 研讨 会 ”出 道 的 、 北 京 交 通 大 学 的 于 剑 教 授 对 本 书 一 些 概念 的 讨 
论 。 感 谢 家 人 和 我 的 学 生 们 的 理解 和 默默 支持 。 没 有 他 们 在 生活 和 科研 上 
的 顺畅 配合 ， 我 也 不 可 能 有 多 余 的 时 间 来 写 这 个 科普 系列 。 也 感谢 国家 自 
然 科 学 基金 ( 资助 号 :61673118 )、 上 海 市 “ 脑 与 类 脑 智 能 基础 转化 应 用 研究 ” 
市 级 科技 重大 专项 资助 ( 项 目 编号 : NO.2018SHZDZX01 ) 和 张江 实验 室 对 
本 书 的 支持 。 

仅 以 此 书 献 给 我 的 博士 导师 : 王 球 研究 员 
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= 视觉 倒 像 


基于 人 工 智能 设计 的 机 器 会 犯错 ， 其 错误 要 么 是 因为 用 来 学 习 的 数据 
量 太 少 ， 无 法 涵盖 解决 问题 所 需要 的 数据 或 样本 空间 ; 要 么 是 由 于 训练 太 
过 精细 ， 导 致 没 办 法 对 新 来 的 未 知 样本 或 数据 形成 有 效 预测 ， 俗 称 为 过 拟 
合 ; 要 么 是 基于 人 工 智 能 设计 的 模型 本 身 能 力 低 ， 结 果 对 样本 的 刻画 能 
不 足 ; 要 么 是 硬件 条 件 受 限 ， 无 法 完成 相关 任务 。 不 管 哪 种 错误 ， 总 是 多 
少 能 找到 原因 的 。 

而 智能 体 尤 其 是 人 类 的 犯错 ， 却 有 很 多 缺乏 明晰 的 解释 。 人 类 会 在 很 
多 方面 犯错 , 产生 错误 的 判断 , 视觉 上 、 听 觉 上 、 距 离 上 、 认 知 上 、 情绪 上 ， 
甚至 人 类 发 育 的 基础 ， 即 基因 上 ， 都 存在 犯错 。 为 什么 这 样 一 种 错误 频 出 
的 智能 体 ， 却 能 凌驾 于 其 他 生命 之 上 成 为 地 球 的 主宰 呢 ? 这 些 犯 错 到 底 有 
什么 用 呢 ? 了 解 这 些 犯 错 ， 说 不 定 能 从 中 找 出 一 些 有 用 的 线索 ,来 重新 思 
考 人 工 智 能 的 发 展 方向 。 

我 们 不 妨 先 从 人 类 在 视觉 上 的 犯错 表现 聊 起 。 这 种 犯错 常 被 称 为 光学 
错觉 ( optical illusion ). 

先 从 光学 成 像 说 起 ， 第 一 个 还 没 得 到 完全 认识 ， 却 又 是 最 基本 的 ， 是 
视觉 倒 像 问 题 。 小 孔 成 像 原 理 ( 图 1.1 ) 告诉 我 们 ， 要 观测 的 目标 通过 瞳孔 
的 凸透镜 原理 映射 至 视网膜 上 ， 是 一 个 标准 的 倒 像 。 如 果 是 机 器 ， 则 可 以 


简单 视觉 错觉 。 


通过 光学 变换 还 原 成 正常 的 影像 。 而 智能 体 似 乎 并 没有 光学 变换 的 能 力 ， 
从 视网膜 获得 的 视觉 信息 ， 会 经 过 视神经 送 往 大 脑 。 人 类 的 视网膜 上 位 于 
中 间 位 置 APPR, fovea) 的 视 锥 细胞 (cone cells ) 和 周边 的 视 杆 细 
胞 (rod cells) 主要 承担 感受 光 强 、 颜 色 和 运动 状态 的 功能 ， 似 乎 没有 自动 
翻转 的 能 力 。 


图 1.1 眼睛 的 小 孔 成 像 原理 


假如 没有 自动 翻转 成 正常 影像 而 倒 着 看 世界 会 如 何 呢 ? 金庸 先生 的 武侠 
书 《 射 雕 英雄 传 》 谈 到 过 。 西 毒 欧 阳 锋 为 了 学 习 从 黄蓉 那儿 弄 来 的 假 “ 九 阴 
真 经 ”, 居然 赁 自己 的 深厚 功底 , 将 全 身 经 脉 颠倒 移 位 , 逆 练 “ 九 了 明 “ 假 "经 ”。 
结果 走火 人 魔 ， 变 成 手 当 足 、 足 当 手 来 倒立 走路 。 武 林 中 人 都 以 为 他 从 此 废 
掉 了 。 可 没 曾 想 ， 经 过 一 段 时 间 后 ， 他 似乎 已 经 习惯 这 种 颠倒 的 世界 ， 而 且 
功力 精进 ， 练 成 了 一 套 新 的 武功 ， 并 在 第 二 次 华山 论 剑 中 夺 得 天 下 第 一 。 

当然 ， 这 只 是 小 说 中 的 虚构 。 但 从 历史 来 看 ， 还 真有 科学 家 做 过 这 样 
的 尝试 。1897 年 ， 美 国 心理 学 家 乔治 WELT (George Stratton). 发 表 
了 《视网膜 没有 逆转 视觉 》 的 论文 中。 在 论文 中 ， 他 详细 介绍 了 关于 视 网 
膜 倒 像 的 实验 ( 图 1.2 )。 他 给 自己 戴 了 一 副 凸 透镜 ， 并 把 其 中 一 只 眼 
有 睛 完全 遮 住 。 在 前 四 天 ,本 已 被 凸透镜 纠正 过 来 的 正 像 ， 他 看 到 的 却 始终 
是 倒 的 。 结 果 ， 以 平时 经 验 去 拿 东 西 都 很 失败 和 别扭 。 因 为 影像 是 倒 过 来 
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的 ， 而 手势 却 还 是 按 正 常 的 思 
维 来 行动 ， 想 拿 地 上 的 物品 手 
会 往 上 伸 ， 想 拿 架 子 上 的 东西 
手 却 往 下 放 。 不 过 到 第 五 天 后 ， 
他 的 视觉 奇怪 地 、 自 发 地 变 成 
正 像 了 ， 好 像 视觉 神经 已 经 适 
应 了 ,他 肢体 的 动作 也 再 次 与 
图 1.2 视觉 倒 像 实 验 趾 世界 协调 了 。 但 再 取 掉 凸透镜 
后 ， 他 发 现世 界 竞 然 都 是 颠倒 
的 , 之 前 的 正 像 要 再 过 一 段 时 间 才 能 恢复 。 换 一 只 眼 执行 此 实验 , 情况 依旧 。 
因此 ， 他 断定 人 的 视网膜 并 没有 把 倒 像 颠倒 过 来 ， 其 功能 是 在 视觉 神经 的 
后 端 实现 的 。 即 ， 视 网 膜 感受 的 颠倒 信号 ， 通 过 视神经 传导 到 大 脑 皮质 的 
视觉 中 枢 后 ， 是 在 视觉 中 枢 实 现 自动 翻转 的 。 这 也 是 目前 学 术 界 的 共识 。 

其 实 还 有 个 简单 的 办 法 可 以 检验 视觉 在 视网膜 位 置 是 倒 像 的 。 你 读 到 
这 里 的 时 候 ， 不 妨 把 手 放 到 下 眼皮 底下 ， 用 手 把 下 眼皮 慢 慢 往 上 推 。 你 应 
该 能 看 到 一 整 块 模糊 掉 的 字 和 图 向 下 走 ， 而 不 是 向 上 。 视 觉 能 力 强 的 , 说 
不 定 在 下 眼皮 谈 挡 眼睛 的 过 程 中 ， 看 到 上 方 会 出 现 一 块 黑 广 。 这 些 恰恰 就 
是 光学 视觉 倒 像 造成 的 。 

后 期 有 很 多 科学 家 想 重复 乔治 斯 特 拉 顿 的 实验 ,不 过 比较 遗憾 的 是 ， 
没有 人 观察 到 过 倒 像 还 能 适应 后 翻转 的 现象 ,更 多 的 是 表示 能 够 适应 颠倒 
过 来 的 世界 。 

不 过 也 有 科学 家 在 尝试 中 发 现 ， 如 果 戴 那 种 会 导致 变形 的 眼镜 时 ， 类 
似 哈 哈 镜 那 种 ， 有 些 人 的 视觉 会 自动 将 一 些 没 注意 到 的 变形 的 位 置 纠 正 。 
而 取 下 眼镜 后 ， 看 到 的 世界 反而 变 得 扭曲 了 。 这 似乎 表明 大 脑 有 可 能 会 自 
适应 地 纠正 一 些 扭曲 。 


CEEE 

现实 生活 中 ， 也 有 一 些 人 会 故意 去 阅读 
一 些 颠 倒 过 来 的 书本 。 据 说 精通 9 门 外 语 、 
号 称 “ 清 末 怪 杰 ” 的 近代 东方 华 学 中 国 第 一 
人 素 鸿 铭 ( 图 1.3 ) 有 一 次 在 英国 街头 就 故意 
倒 拿 报纸 。 有 路 人 看 到 后 便 笑 说 :“ 看 这 个 中 
国人 多 策 ， 居 然 报纸 都 拿 倒 了 ， 还 假装 懂 英 
文 。” 带 鸿 铭 便 说 :“ 英 文 太 简单 ， 正 着 读 ， 显 
不 出 本 事 。” 然 后 便 熟 练 地 倒 读 报纸 ， 发 音 都 
是 地 道 的 伦敦 腔 外。 Les 

. . m 图 1.3 Apis P! 

除去 那些 想 通 过 这 种 方式 吸引 他 人 注意 的 
人 以 外 ， 甚 他 真正 这 么 读书 本 的 ， 可 能 是 将 其 视 为 提高 阅读 速度 和 能 力 的 
一 种 秘技 。 还 有 科学 家 说 ， 通 过 这 种 方式 ， 可 以 刺激 大 脑 形成 新 细胞 ， 防 
止 衰老 。 其 实 大 家 稍微 练 练 ， 也 不 难 做 到 。 所 以 ， 以 后 看 见 倒 着 看 报纸 、 
读书 的 人 或 新 闻 照 片 时 ， 不 要 马上 就 哺 笑 ， 说 不 定 他 们 真 的 能 这 样 读 。 

另外 ， 作 为 感官 元 件 ， 眼 睛 和 其 他 感觉 器 官 还 有 点 不 一 样 。 它 是 在 
大 脑 发 育 过 程 中 ， 从 脑 细胞 中 分 裂 出 来 的 。 如 果 把 从 眼球 到 视觉 中 枢 的 
连接 看 成 是 一 个 深度 学 习 模型 ， 即 当今 人 工 智 能 领域 最 流行 的 预测 模型 ， 
也 许可 以 将 这 种 视频 倒 像 的 纠正 ， 理 解 为 大 脑 处理 的 端 到 端 (end-to-end ) 
表现 ， 即 输入 是 正 像 ， 输 出 也 是 正 像 ， 中 间 的 纠正 都 在 深度 学 习 模型 中 自 
动 完 成 了 。 

但 倒 像 纠正 具体 是 何 时 发 生 的 ， 乔 治 : 斯 特 拉 顿 没有 给 出 研究 结论 。 
现 有 的 文献 也 是 说 法 不 一 。 有 说 初生 儿 开 始 感知 的 世界 是 颠倒 的 ， 随 着 大 
脑 发 育 的 逐步 完善 而 慢 慢 实 现 。 因 为 有 报道 说 ， 有 些 两 三 岁 的 小 孩 可 能 嘉 
欢 倒 拿 玩具 ， 倒 读 连 环 画 ， 并 猜测 这 可 能 和 正视 发 育 未 完全 有 关 。 还 有 些 
人 ， 如 塞尔维亚 的 博 亚 纳 . 达 尼 洛 维 奇 (Bojana Danilovic ), 据说 天 生 就 有 
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空间 定向 障碍 现象 ( spatial orientation phenomenon ), 看 的 世界 都 是 颠倒 的 中。 
所 以 ， 她 用 的 电脑 和 键盘 都 是 反 过 来 的 (图 1.4) 也 有 说 倒 视 能 力 是 与 生 
俱 来 的 ， 毕 竞 前 者 的 例子 还 是 很 鲜 见 。 另 外 ， 有 不 少 飞 行 员 在 飞行 中 会 出 
现 空间 迷 向 ( spatial disorientation ) 或 定向 力 障 碍 的 问题 ， 即 分 不 清 天 上 与 
地 上 ,或 者 把 星星 的 光 误 以 为 是 地 面 的 “灯光 ”"。 这 种 倒 视 有 极 大 的 危害 
处 理 不 当 甚 至 可 能 导致 飞机 坠毁 。 


图 1.4 患 有 “空间 定向 障碍 ”的 塞尔维亚 女子 


不 管 怎么 说 ,“ 倒 像 ” 这 个 看 似 极 其 简单 的 问题 仍然 没 有 找到 统一 贺 
满 的 答案 ， 不 论 是 它 的 成 因 还 是 发 生 时 间 上 。 


简单 视觉 错觉 。 


=@ 颠倒 的 视界 


上 回 讲 到 ， 光 学 倒 像 这 一 简单 的 现象 ， 在 何 时 纠正 和 如 何 完成 上 ， 还 
没有 形成 统一 和 完美 的 答案 。 除 此 以 外 ， 以 下 三 种 情况 的 颠倒 视界 也 会 影 
响 人 的 和 判断， 导致 错 判 或 判断 障碍 ， 甚 至 产生 光学 幻觉 。 

人 脸 翻 转 效应 (face inversion effect ) 

图 2.1 是 网 络 上 经 常 能 看 到 的 颠倒 错觉 图 片 。 左 图 正 看 是 一 位 老 太 太 ， 
但 如 果 把 图 像 颠倒 过 来 后 ， 却 能 看 到 一 位 戴 着 皇冠 的 美女 。 类 似 的 颠倒 错 
觉 图 还 有 不 少 。 这 类 图 产生 二 义 性 的 原因 ， 主 要 缘 于 人 的 视觉 系统 具有 整 
体 结构 观 ， 以 及 依赖 于 人 的 先 验 知识 或 以 往 经 验 。 

观看 一 张 人 脸 图 时 ， 人 们 会 自然 地 把 眼睛 下 面 的 结构 按 锚 子 、 嘴 巴 、 
脖子 的 次 序 依 次 排序 去 联想 和 匹配 ， 而 眼睛 上 方 的 结构 则 往 头 发 、 头 饰 去 
想象 。 很 少 人 会 不 按 这 样 的 结构 次 序 来 反 向 思维 。 它 表明 ， 如 果 忽略 了 与 
生活 常识 中 次 序 相 反 的 细节 结构 ， 就 有 可 能 产生 颠倒 错觉 。 当 然 ， 如 果 你 
有 倒 过 来 阅读 的 习惯 ， 其 实 也 能 从 老 太 太 的 图 上 直接 看 到 倒 过 来 的 美女 。 

更 有 意思 的 是 ， 某 些 图 像 ， 尤 其 是 人 脸 ， 即 使 只 是 简单 地 翻转 ， 也 可 
能 导致 认 知 障碍 。 

1969 年 科学 家 英 (Yin) 第 一 次 在 文献 中 报道 ， 翻 转 脸 对 于 识别 的 影 
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响 要 大 于 翻转 其 他 范畴 图 像 的 影响 外 。 自 此 以 后 ， 很 多 科学 家 开始 研究 人 
脸 翻 转 效应 ， 并 试图 给 出 合理 的 解释 。 


图 2.1 其 倒 错 觉 中 的 老 太 太 与 美女 画像 


加 拿 大 安大略 省 女王 大 学 ( Queen's University ) 的 弗 雷 尔 (Freire ) 等 
三 位 研究 人 员 曾 在 2000 年 展开 深入 研究 马 。 他 们 首先 将 多 个 人 脸 图 像 进行 
统计 平均 ， 以 形成 平均 人 脸 。 基 于 对 图 2.2 平均 人 脸 的 研究 实验 ,他们 分 析 
了 人 脸 翻 转 效 应 。 

他 们 注意 到 ， 在 正 脸 情况 下 ， 如 果 从 整体 结构 或 构 型 ( configural ) 的 
角度 出 发 ， 人 能 够 以 81% 的 精度 区 分 人 脸 。 当 人 脸 被 翻转 后 ， 就 只 有 55% 
的 识别 精度 了 。 而 如 果 要 求 测试 者 辨识 人 脸 上 的 特征 ， 如 眼睛、 眉毛 、 鼻 
子 之 类 的 ， 那么 翻转 的 影响 就 很 轻微 。 此 时 的 结果 表明 ， 正 常 脸 的 识别 精 
度 是 91%， 翻 转 了 也 有 90% 的 精度 。 如 果 考 虑 延迟 的 影响 ， 他 们 发 现 隔 
1-10 秒 后 ， 再 让 测试 者 重新 去 识别 ， 则 不 管 是 正 脸 还 是 翻转 脸 ， 在 构 型 上 
或 特征 上 的 差异 都 能 正确 识别 ， 人 脸 翻 转 效 应 似乎 消失 了 。 从 这 些 实验 ， 
他 们 推断 ， 人 脸 翻 转 效 应 中 起 主要 作用 的 是 构 型 ， 即 整体 结构 对 识别 的 影 


响 更 大 。 但 这 也 可 以 算 作 构 型 编码 的 一 个 缺陷 ， 比 如 双胞胎 就 很 难 通过 构 
型 编码 来 区 分 。 

由 于 在 时 间 上 和 识别 率 上 的 差异 极 细 微 ， 他们 还 推断 ， 这 种 构 型 缺陷 
主要 发 生 在 人 脸 处 理 的 编码 阶段 ， 而 不 是 后 面 的 人 脸 存 储 阶 段 。 这 与 图 2.1 
中 我 们 不 容易 发 现 老人 图 像 中 隐藏 的 美女 的 情况 是 吻合 的 。 


颠倒 脸 


基于 特征 的 


图 2.2 人 脸 翻 转 效应 
第 二 行 表 明 人 脸 构 型 上 的 垂直 ( Vertical) 距离 在 翻转 后 会 被 错 判 


另外 ， 科 学 家 Carbon 和 Leder? 在 研究 中 发 现 ， 正 脸 比 翻转 后 的 脸 的 
全 局 信息 能 更 快 获得 。 但 是 ， 在 翻转 脸 后 ， 特 征 的 提取 则 要 先 于 整体 信息 
进行 处 理 。 而 要 在 短 时 间 (如 26 毫秒 ) 处 理 局 部 特征 信息 ， 则 具有 上 下 文 
言 息 的 整体 结构 处 理 是 必要 的 。 

总 的 来 说 ， 翻 转 效 应 影响 了 人 对 人 脸 的 空间 关系 ， 即 人 脸 构 型 的 认 知 7, 
但 是 ， 人 脸 翻 转 效 应 还 没有 一 个 终结 者 的 解释 。 有 兴趣 的 朋友 可 以 在 网 络 
上 搜索 “face inversion effect"， 应 该 可 以 查 到 不 少 最 近 的 相关 文献 。 另 外 ， 


爱 犯错 的 智能 体 


大 家 如 果 读 完 本 书 《 灵 光一 闪 与 认 知 错觉 》 一 文 ， 不 妨 再 回来 重读 一 下 本 
篇 内 容 ， 也 许 会 有 不 同 的 答案 。 

相反 ， 现 有 的 人 工 智 能 技术 是 不 用 担心 翻转 对 识别 性 能 的 影响 ， 尤 其 
在 当下 深度 学 习 中 ,引入 了 生成 式 对 抗 网 络 的 深度 神经 网 络 模型 和 数据 增 
广 技术 后 。 因 为 ,在 这 些 模型 和 技术 中 ， 翻 转 常 被 作为 丰富 ( 人 脸 ) 训练 
数据 集 的 手段 之 一 。 因 此 ， 翻 转 不 会 损害 人 脸 识别 算法 的 预测 性 能 ， 反 而 
有 可 能 帮助 提高 性 能 。 

但 从 认 知 的 角度 看 ， 这 是 否 意味 着 我 们 在 提高 预测 能 力 的 同时 ， 有 可 
能 损失 了 “拟人 ”的 某 些 认 知 功能 呢 ? 也 许可 以 推断 ， 人 脸 翻 转 效 应 表明 , 
现 有 的 人 工 智 能 技术 在 人 脸 识 别 的 处 理 方法 上 和 人 在 人 脸 的 认 知 上 存在 根 
本 的 不 同 。 理 解 这 些 差异 ， 也 许 是 通 向 更 接近 智能 体 的 智能 和 “人 机 混合 ” 
智能 方向 的 线索 之 一 。 

正片 负片 的 人 脸 识别 


不 仅 在 图 像 方向 上 的 翻转 会 引起 认 知 障碍 ， 甚 至 对 图 像 做 简单 的 、 按 
照 光 的 强度 值 进行 的 翻转 也 会 让 原来 的 人 脸 识别 变 得 更 困难 。 


(a) (b) 
图 2.3 人 脸 图 像 的 正片 (a) 和 负片 (c) 以 及 变换 公式 (b) 
图 (b) 中 ， 横 坐标 是 输入 的 图 像 强 度 变 量 7， 最 大 强度 为 L-1, ded T 255 
纵 坐 标 是 变换 后 的 强度 S， 最 大 强度 为 L-1。 斜 线 是 正 负片 的 翻转 函数 ， 直 观 来 看 ， 
Ppa (255) 变 为 黑 (0) ， 黑 (255) €& (0) 
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图 2.3 (a) 是 一 张 正 常 的 人 脸 QE: 作者 年 轻 时 的 照片 )， 如 果 对 其 用 
图 23 (b) 的 函数 进行 翻转 变换 ， 即 白 变 黑 、 黑 变 白 的 简单 翻转 ， 则 有 了 
图 2.3 Cc) 的 负片 图 像 。 人 在 识别 和 记忆 图 2.3 (a) 人 脸 时 ， 是 不 太 需要 费 
脑筋 的 。 虽 然 用 的 函数 变换 也 很 简单 , 但 对 于 图 2.3 Ce), 如 果 没有 图 2.3 (a) 


做 参照 ， 人 们 可 能 很 难 联想 其 真实 的 相貌 ,更 不 用 说 做 有 效 识 别 了 。 这 种 
差异 也 许 是 由 于 日 常生 活 缺 乏 对 负片 的 图 像 进行 学 习 造 成 的 ， 因 为 人 的 视 


网 膜 细 胞 主要 是 感光 细胞 ， 只 能 接受 光源 传 过 来 的 正 能 量 。 又 可 能 是 由 于 


智能 体 缺乏 与 “翻转 ”相关 的 数学 计算 能 力 , 没有 演化 出 有 效 的 办 法 。 所 以 ， 
不 能 在 大 脑 自动 将 图 2.3 (b) 的 “翻转 ”函数 求 反 ， 尽 管 智能 体 可 以 实现 


前 一 篇 所 讲述 的 光学 倒 像 的 自动 纠正 。 
ERER 
除了 以 上 两 种 颠倒 ， 人 的 视觉 还 有 翻转 颜色 的 “特异 功能 *"。 如 图 2.4 
所 示 ， 如 果 你 杂 着 这 张 图 中 间 的 4 个 点 静 看 30 
Ph. 再 去 看 一 面 白色 的 墙 或 屏幕 的 空白 处 ,或 
不 停 地 用 眼 ， 你 的 眼前 便 会 浮现 出 耶稣 的 影子 
这 个 影子 看 上 去 就 像 是 由 图 上 黑色 背景 内 部 的 
部 分 ， 通 过 黑 变 白 、 白 变 黑 互 补 所 形成 的 图 像 。 
至 于 为 什么 会 有 这 样 的 结果 ， 也 是 众说 
纷 颖 。 比 较 靠 谱 的 解释 是 ， 这 是 一 种 图 像 烙 印  — 024 Teža 
(burn-in ) 或 持续 性 记忆 现象 。 当 一 个 非常 明亮 的 目标 处 在 视野 的 关注 焦点 
时 ， 会 在 视网膜 上 短暂 地 打上 烙印 。 如 果 随 后 闭 眼 或 者 重复 性 地 区 眼 ， 这 
个 烙印 仍然 还 会 持续 一 段 时 间 。 
也 有 观点 表示 ， 人 的 眼睛 是 由 视 锥 细胞 和 视 杆 细胞 组 成 。 其 中 ， 视 骏 
细胞 主要 负责 环顾 四 周 。 如 果 长 期 只 盯 着 同一 目标 看 的 话 ， 那 么 视 锥 细胞 


“，” 爱 犯错 的 智能 体 


就 容易 工作 过 度 ， 人 快速 导致 疲劳 。 结 果 ， 如 果 离 开 盯 着 的 目标 后 ， 疲 劳 的 
视 锥 细胞 不 会 迅速 反馈 新 看 到 的 颜色 到 大 脑 ， 比 如 新 看 到 的 白色 墙壁 。 而 
大 脑 还 需要 对 老 的 信息 进行 解释 ， 因 为 它 并 没有 收 到 强 的 、 新 的 信和 号。 

还 有 观点 将 其 称 为 视觉 后 效 (aftereffects in visual )， 即 连续 注视 相同 
图 形 之 后 ， 会 导致 感知 被 影响 ， 随 后 影响 感受 到 的 图 形 结果 。 这 种 知觉 现 
象 最 早 由 E. H. 维尔 霍 夫 于 1925 年 发 现 ， 后 来 很 多 科学 家 都 对 这 一 现象 进 
行 了 系统 的 研究 P. 

这 些 观点 都 认同 ， 随 着 视网膜 神经 细胞 功能 的 恢复 ， 这 个 现象 会 逐渐 
消退 。 因 为 这 种 现象 能 带 来 很 多 奇特 的 视觉 效果 ， 这 或 多 或 少 可 以 解释 ， 
为 什么 大 多 数 艺 术 馆 里 都 偏好 以 白 墙 来 装饰 。 

不 管 怎么 说 ， 人 眼 的 这 些 错 觉 现象 表明 ， 人 内 在 的 认 知 行为 ， 可 能 比 
我 们 现在 人 工 智 能 所 能 实现 或 理解 的 功能 要 复杂 ， 需 要 做 更 多 的 探索 。 

关于 颠倒 的 视界 就 写 到 这 里 。 下 篇 介绍 智能 体 的 另 一 种 视觉 错觉 。 


简单 视觉 错觉 


=@) 看 不 见 的 萨摩 耶 


我 家 附近 曾经 有 只 白色 的 萨摩 耶 ， 大 约 12 9, x ER 
顺 的， 基本 不 怎么 呐 叫 。 听 说 主人 身体 不 好 ， 行 动 不 便 ， 于 
是 就 放任 其 在 外 乱 注 。 它 虽然 个 头 不 小 ， 马 路 什么 都 过 得 好 
好 的 ， 就 这 么 自 顾 自 地 生活 着 。 可 某 天 它 过 人 行 横道 的 时 候 ， 
一 辆 左 转 的 车 辆 速度 和 它 过 马路 的 速度 一 致 ， 导 致 它 进 入 了 
驾驶 员 的 A 柱 育 区 。 等 萨摩 耶 反 应 过 来 时 ， 车 已 经 对 着 它 冲 
了 过 来 ， 左 前 轮 压 了 一 次 ， 左 后 轮 又 压 了 一 次 …… 它 身 在 车 
后 ,无 助 地 颤 持 着 、 记 号 着 。 两 旁 的 行人 默默 地 看 着 它 。 车 
主 坐 在 车 里 ， 没 开 窗 没 下 车 ， 不 知道 是 何 反 应 。 过 了 一 会 儿 ， 
狗 用 力 翻身 站 了 起 来 ， 摇 摇晃 晃 走 起 来 了 ， 准 备 回 家 。 观 望 
的 行人 们 都 松 了 一 口气 ， 有 人 笑 了 ， 说 狗 没事 了 。 车 主见 状 ， 
赶紧 一 溜 烟 开车 跑 了 。 可 是 , 狗 走 了 不 到 200 X, 便 慢 了 下 来 ， 
实在 是 走 不 动 了 ， 满 嘴 的 鲜血 。 于 是 ， 它 便 安 静 地 躺 在 人 行 
iÉ E, BFH, — RH 希望 它 下 华 子 ， 不 
要 走 得 这 么 凄惨 。 
作为 智能 体 ， 人 的 视觉 和 机 器 视觉 是 存在 区 别 的 。 其 中 一 个 非常 特别 
的 区 别 是 ， 人 会 根据 情况 或 上 下 文 有 意 无 意 地 忽略 眼中 看 到 的 目标 。 
1999 年 两 位 权威 心理 学 专家 克里斯托弗 "下. 查 布 里 斯 ( Christopher F. 
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Chabris ) 和 丹尼尔 * J 西蒙 斯 ( Daniel J. Simons ) 曾 做 过 一 次 “看 不 见 的 
大 猩猩 ”的 实验 。 因 为 这 个 传说 中 心理 学 史上 最 强大 的 “大 猩猩 实验 ”, 两 
人 荣获 了 2004 年 的 “搞笑 诺 贝尔 奖 "。 在 播放 的 视频 中 ， 有 几 个 人 一 起 打 
篮球 ， 在 投篮 的 过 程 中 还 会 有 一 只 人 扮演 的 大 猩猩 从 右 向 左 走 过 ， 并 在 视 
频 的 中 间 位 置 稍 作 停 留 。 而 测试 者 观看 视频 时 ， 给 他 们 分 配 的 任务 是 统计 
打 篮 球 的 人 投篮 命中 的 次 数 。 当 视频 播放 完 ， 测 试 者 报告 的 进 球 数 基本 都 
是 准确 的 。 可 是 ， 当 问 他 们 ， 有 没有 注意 到 视频 中 有 只 人 扮 的 大 猩猩 从 视 
频 中 走 过 时 ， 却 有 不 少 人 没 能 回想 起 来 。 

类 似 的 实验 ,英国 赫 特 神 德 大 学 的 心理 学 怪 才 、 理 查 德 * 威 斯 曼 
(Richard Wiseman ) 教授 也 做 过 ， 叫 变色 纸牌 游戏 ( The colour changing 
card trick 准 。 他 和 一 位 女 助手 一 起 在 摄像 机 前 表演 玩 牌 的 魔术 。 表演 的 过 程 
中 ， 身 上 的 衣服 、 背 景 、 桌 布 都 被 换 掉 了 。 但 由 于 有 多 台 摄 像 机 的 切换 ， 
人 的 关注 焦点 一 直 被 诱导 ， 结 果 观测 者 只 注意 了 两 位 “魔术 师 ” 手 中 扑克 
牌 的 变化 ， 而 压根 没 发 现 视频 中 换 掉 的 物品 。 

如 果 利 用 人 工 智能 算法 来 跟踪 并 区 分 变化 的 目标 ， 会 很 轻松 发 现 其 中 
的 区 别 。 因 为 计算 机 在 检测 目标 时 ， 会 计算 像素 位 置 上 的 光 的 强度 变化 。 
所 以 ， 当 视频 中 出 现 大 猩猩 ， 或 者 变换 桌布 、 背 景 、 衣 服 时 ， 都 意味 着 视 
频 中 帧 与 帧 之 间 出 现 了 大 面积 像素 的 强度 变化 。 这 种 变化 ， 很 容易 超过 图 
像 变化 程度 的 阔 值 ， 导 致 被 人 工 智能 算法 检测 和 发 现 。 值 得 指出 的 是 ， 检 
测 这 类 变化 也 是 现在 做 视频 摘要 、 视 频 关 键 内 容 提 取 的 基本 手段 之 一 。 

反观 人 类 ， 却 容易 出 现 忽略 目标 的 情况 。 其 原因 在 于 ， 当 人 关注 某 个 
目标 时 ， 目 标 将 成 像 于 视网膜 的 焦点 即 中 央 四 区 域 ， 而 目标 周围 的 内 容 则 
分 布 在 中 央 四 的 周边 ， 由 视 杆 细胞 来 负责 感知 。 而 视 杆 细 胞 主要 负责 运动 ， 


CD 视频 链接 : https//v.qq.com/x/page/t0323pisjzt.html 
© 视频 链接 : https//v.qq.com/x/page/q0114mwdmgw.html 
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对 具体 细节 不 敏感 。 所 以 ,在 这 一 前 提 下 ， 大 猩猩 就 被 大 脑 视觉 中 枢 视 为 
没有 多 大 意义 的 像素 点 运动 ， 甚 至 被 篮球 的 运动 所 掩盖 。 换 衣服 、 桌 布 等 
也 是 类 似 的 原因 。 

除 此 以 外 ， 也 许 是 因为 人 类 其 实 是 一 种 能 偷懒 就 会 偷懒 的 智能 体 。 如 
果 能 够 在 不 经 过 续 密 思维 就 能 保证 大 部 分 判断 成 功 的话 ， 人 类 会 倾向 于 优 
先 采 用 更 简易 的 判断 ， 而 不 是 进行 过 多 的 细致 分 析 。 就 像 平时 走路 一 样 ， 
我 们 也 没有 像 机 器 人 一 样 去 区 分 路 面 的 高 低 差 异 、 纹 理 差异 、 光 强 差异 ， 
但 却 能 非常 有 效 和 快速 地 形成 决策 。 即 使 存在 例外 ， 那 也 是 极 个 别 的 情况 。 

这 种 现象 ， 在 日 常生 活 中 ， 则 有 可 能 带 来 潜在 的 危险 。 比 如 交通 中 ， 
在 一 个 平时 很 少 有 行人 经 过 而 车 辆 较 多 的 十 字 路 口 ， 驾 驶 员 的 关注 焦点 往 
往 是 行驶 的 汽车 ， 其 目的 以 避让 汽车 为 主 。 在 成 年 人 经 常 走 过 的 人 行 横道 
附近 ， 则 驾驶 员 的 关注 视角 会 以 成 人 为 主 。 第 一 个 例子 可 能 导致 的 危险 是 
如 果 某 天 突然 出 现 非 机 动车 或 行人 时 ， 司 机 会 注意 不 到 ， 不 容易 形成 应 急 
反应 ; 第 二 种 情况 则 可 能 会 导致 对 矮小 目标 ( 如 儿童 ) 的 忽视 。 

这 种 危险 能 避免 吗 ? 有 心理 学 家 指出 ， 如 果 关 注 的 焦点 不 变 ， 这 样 的 
定式 或 习惯 性 思维 会 一 直 存 在 ， 且 很 难 避 免 。 结 果 ， 当 驾驶 员 发 现 危 险 来 
临时 ， 已 经 缺乏 足够 的 反应 时 间 ， 极 易 发 生 交通 事故 ， 造 成 不 必要 的 人 员 
fiiv: P. 

那 如 何 解 决 呢 ? 最 简单 的 办 法 就 是 ， 驾 驶 员 在 经 常 经 过 的 路 口 不 要 形 
成 定式 思维 。 但 凡 碰 到 这 类 路 线 时 ， 不 妨 想 想 ， 这 里 可 能 有 条 看 不 见 的 萨 
摩 耶 ; 不 妨 多 变化 下 关注 的 视野 ， 如 左右 晃 下 头 ， 避 开 A、B 柱 盲区 和 看 不 
见 的 “盲区 ”， 最 大 程度 地 避免 这 类 事故 的 发 生 。 


看 不 见 的 盲点 


人 的 视觉 不 仅 有 视而不见 的 特点 ， 也 有 弥补 先天 不 足 的 能 力 。 我 们 的 
视神经 感受 周围 环境 后 ， 还 需要 将 信号 送 到 大 脑 。 送 的 方式 挺 聪 明 ， 大 脑 
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简单 视觉 错觉 。 


爱 犯错 的 智能 体 


图 3.1 人 眼 构 造 ， 视 神经 传输 位 置 没有 感 
光 细 胞 


图 3.2 生理 性 盲点 测试 图 


将 输送 信号 的 视神经 像 头发 一 样 
扎 成 左边 一 股 ,右边 一 股 ,， 在 每 
个 眼球 视网膜 中 央 凹 偏 外 约 20° 
处 集中 起 来 ， 向 大 脑 输 送信 号 。 
遗憾 的 是 ， 视 网 膜 这 个 位 置 上 就 
没 法 生长 感光 细胞 ， 于 是 形成 了 
生理 性 盲点 ， 如 图 3.1 所 示 。 

要 检测 盲点 的 具体 位 置 ， 不 
妨 试 试图 3.2 这 个 经 典 的 盲点 测 
试图 。 首 先 ， 播 住 左 眼 ， 用 右 了 眼 
盯 着 图 上 的 圆 点 ， 将 图 片 逐渐 拉 
远 或 拉 近 ， 会 发 现在 某 个 位 置 时 
十 字 会 消失 。 这 个 位 置 ， 就 对 应 
于 你 的 右 眼 讶 点。 类 似 的 ， 插 住 
AIR, 用 左 眼 盯 着 右边 的 十 字形 ， 
移动 图 片 远近 ， 会 发 现 圆 点 在 某 
个 位 置 消失 了 。 它 对 应 于 左 眼 的 


盲点 位 置 。 


虽然 有 盲点 ， 所 地 人 是 双 目 视觉 ， 所 以 两 只 眼睛 的 盲区 会 通过 双 目 视 
觉 来 相互 弥补 。 结 果 ， 日 常生 活 中 ， 人 就 感觉 不 到 盲点 的 存在 。 不 过 ， 如 
果 单 眼 存在 眼疾 ， 如 患 上 和 白内障， 那 育 点 的 影响 就 比较 大 了 ， 毕 竞 有 个 位 
置 的 信息 是 缺失 的 ， 这 就 需要 通过 多 调整 视角 来 消解 这 个 困扰 。 


看 不 见 的 笔 一 一 单眼 与 复眼 


除了 盲点 外 ， 还 有 种 情况 ， 人 也 会 对 目标 视而不见 。 各 位 不 妨 试 着 拿 
起 一 文笔 ， 竖 直 放 在 左 眼前 面 。 一 开始 ， 你 会 感受 到 笔 对 视野 造成 的 遮挡 。 
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简单 视觉 错觉 。 


再 将 眼睛 盯 着 远 处 某 目标 ,将 笔 缓 慢 远 离 眼 睛 ， 你 将 会 发 现 这 支 笔 并 没有 
对 你 观察 远 处 的 景象 形成 任何 障碍 ， 笔 似乎 凭空 消失 了 。 显 然 ， 这 并 非 是 
生理 性 盲点 造成 的 。 它 和 人 的 视网膜 结构 有 关 ， 可 以 从 单眼 与 复眼 的 关系 
来 解释 。 

众所周知 ， 人 有 两 只 眼睛 ， 而 昆虫 如 晴 晓 、 苍 蝇 的 有 眼睛 则 是 由 非常 多 
的 小 眼睛 组 成 的 ， 俗 称 复眼 。 如 果 是 昆虫 的 复眼 ， 那 么 笔 的 存在 不 会 对 想 
观测 的 目标 形成 遮挡 ， 因 为 昆虫 的 整体 视觉 可 以 通过 拼接 每 只 小 眼睛 关注 
的 内 容 来 获得 ， 少 数 几 只 眼睛 的 视角 被 遮挡 不 影响 全 局 感知 。 可 人 是 双 目 
视觉 ， 为 什么 也 会 有 类 似 的 情况 呢 ? 实际 上 ， 人 的 视网膜 上 的 感光 细胞 数 
量 众多 ， 每 个 细胞 都 分 担 了 一 部 分 的 视觉 检测 。 在 处 理 笔 遮挡 的 任务 时 ， 
会 通过 感光 细胞 间 的 相互 填充 ， 实现 类 似 昆 虫 复眼 的 功能 。 

但 要 注意 的 是 ， 人 是 很 难 像 昆虫 那样 演化 出 复眼 的 。 因 为 昆虫 复眼 上 
的 每 只 眼睛 负责 的 视角 和 频率 都 很 窗 ， 如 果 要 在 人 的 头 部 形成 如 同 昆虫 一 
样 具有 全 角度 检测 能 力 的 复眼 ， 著 名 物理 学 家 费 恩 曼 曾 经 做 过 粗略 的 计算 ， 
他 的 结论 是 复眼 的 大 小 会 超过 现在 人 类 头 部 的 尺寸 ， 人 的 脑袋 很 可 能 承受 
不 了 眼睛 的 重量 OO 

当然 ， 除 了 这 些 情 况 看 不 见 外 ， 人 过 于 关注 某 些 人 或 事情 时 会 对 周围 
情形 视而不见 ， 人 不 关注 某 些 人 或 事情 时 也 会 对 其 视而不见 或 熟视无睹 。 
这 些 依赖 于 情感 和 心灵 的 视而不见 和 熟视无睹 ， 比 起 单 从 视觉 上 发 生 的 ， 
就 要 复杂 多 了 ， 也 是 人 工 智能 目前 还 完全 找 不 到 北 的 研究 方向 之 一 。 


爱 犯错 的 智能 体 


=@ 看 得 见 的 斑点 狗 


先 看 张 图 。 大 家 仔细 看 看 ， 
图 4.1 里 面 有 什么 东西 呢 ? 一 群 
杂乱 无 章 、 形 状 不 一 的 黑色 块 ， 
还 是 其 他 ?如 果 我 说 ， 里面 有 一 


条 低 垂 着 头 的 斑点 狗 ， 可 能 还 
有 一 棵 长 着 茂密 树叶 的 树 ， 你 
都 能 看 见 吗 ? 


也 许 能 ， 也 许 不 能 ， 因 为 
不 是 每 个 人 都 见 过 斑点 狗 。 但 
这 只 看 不 见 的 “斑点 狗 ” 却 引出 了 一 个 人 工 智能 的 话题 ， 一 个 关于 “机 器 ” 
图 像 分 制 和 “心理 ”图 像 分 割 的 话题 ， 一 个 客观 与 主观 图 像 分 割 的 话题 。 

图 像 分 割 (image segmentation )， 简 而 言 之 ， 就 是 把 图 像 中 的 (多 个 ) 
目标 和 背景 分 离开 来 。 它 是 计算 机 视觉 和 图 像 处 理 领 域 的 经 典 研究 方向 ， 
管 这 个 方向 成 果 累 累 ， 但 至 今 仍 未 得 到 圆满 解决 。 对 于 人 工 智 能 而 言 ， 
它 也 是 重要 的 基石 ， 因 为 它 的 性 能 优 劣 决定 了 多 数 人 工 智 能 应 用 的 有 效 性 。 
比如 智能 敬 驶 ， 如 果 不 能 有 效 从 监测 的 视频 中 将 人 人、 车、 交通 标志 、 路 面 、 
建筑 物 等 目标 进行 精确 分 离 ， 那 么 智能 驾驶 就 无 法 实用 。 比 如 视频 摘要 和 
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简单 视觉 错觉 


图 像 理解 ， 如 果 不 能 把 图 像 或 视频 中 的 目标 及 目标 关系 提取 出 来 ， 也 会 碰 
到 类 似 的 困难 。 再 比如 智能 服务 机 器 人 ， 如 果 不 能 将 待 服务 的 主人 或 顾客 
从 视频 中 检测 和 识别 出 来 ， 那 也 就 无 法 提供 有 效 的 服务 。 

要 实现 图 像 分 割 ， 我 们 可 以 采用 很 多 不 同 的 策略 。 比 如 采用 对 图 
像 中 目标 先期 进行 打下 标签 或 标注 再 进行 训练 的 监督 学 习 ( supervised 
learning )， 代 表 方 法 如 按 最 近 距 离 分 类 的 算法 ; 或 者 采用 完全 无 标注 的 非 监 
督学 习 (unsupervised learning )， 代 表 方 法 如 基于 每 个 目标 或 类 别 中 心 的 K- 
均值 (K-mean) 聚 类 算法 ; 或 者 采用 把 图 像 分 解 成 像素 或 像素 块 构成 的 节 
点 与 节点 间 的 连接 边 组 成 的 图 模型 (graph model ) 的 方法 ; 或 者 采用 基于 
类 似 新 华 字 上 典 的 视觉 词 包 ( bag of visual words ) 方法 ; 或 者 采用 基于 目前 流 
行 的 深度 学 习 的 图 像 分 割 。 不 管用 何 种 方法 提取 目标 或 背景 ， 对 目标 的 结 
构 假 设 基本 上 是 一 致 的 。 一 般 都 假设 了 目标 内 部 是 同 质地 的 、 空 洞 比较 少 
的 ， 目 标 与 背景 之 间 的 边界 是 明显 的 、 少 锯齿 状 、 尽 量 光 滑 的 。 图 4.2 就 
是 基于 K- 均值 聚 类 算法 获得 的 图 像 分 割 示例 。 


(a) (b) 
图 4.2 基于 开 - 均 值 聚 类 工法 获得 的 图 像 分 割 示 合 
(a) 月 和 牙 泉 图 像 ; (b) 分 成 三 类 的 图 像 分 割 结果 


另外 ,衡量 图 像 分 割 质量 优 劣 ， 大致 有 两 类 标准 。 要 么 是 人 为 先 把 真 
正 的 分 割 结果 标记 好 ， 再 通过 图 像 相 似 性 或 者 真实 分 割 图 像 与 算法 分 割 后 


爱 犯错 的 智能 体 


图 像 的 信 噪 比 指数 来 客观 评判 ; 要 么 是 视觉 上 根据 用 户 经 验 做 主观 分 析 和 
比较 。 前 者 与 人 感知 的 图 像 分 割 存在 一 定 偏差 .有 时 会 出 现 定量 指标 好 但 
视觉 效果 差 的 图 像 分 割 结果 ; 后 者 则 容易 陷入 “ 公 说 公有 理 、 婆 说 婆 有 理 ” 
的 乾 粹 局 面 ， 让 人 对 图 像 分 割 质量 的 好 坏 没什么 底 。 因 为 有 可 能 某 些 图 的 
分 割 效 果 好 ， 但 某 些 图 的 分 割 效果 又 很 不 好 ， 所 以 难以 验证 其 可 推广 性 。 
除 此 以 外 ， 图 像 分 割 还 具有 多 义 性 。 如 图 4.3 中 花瓶 与 人 ，ABC 和 
12、13、14 中 的 了 与 13， 是 兔子 还 是 鸭子 的 图 。 这 些 图 都 反映 了 主观 意 
识 和 上 下 文 在 图 像 分 割 中 的 重要 性 ， 也 表明 了 图 像 分 割 并 非 像 字面 意义 那 


么 简单 好 处 理 。 
Welhe Thiere gleiden cin: 
ander am meiften? 


\2 IS I4 
C 


(a) (b) (c) 
B43 图 像 分 割 的 多 义 性 示例 
(a) 花瓶 与 人 ; (b) 13 与 B; (c) 兔子 还 是 鸭子 ( 引 自 : Fliegende Blatter, 
1892-10-23 ) 


Kaninden und Ente. 


至 于 看 不 见 的 斑点 狗 ， 它 涉及 男 一 层 的 “图 像 分 割 ” 一 一 主观 意识 下 
的 图 像 分 割 和 目标 提取 。 图 像 中 本 没有 明显 的 斑点 狗 ， 可 是 当 给 予 线索 瞳 


示 后 ， 人 会 根据 提示 ， 从 自己 先前 的 知识 中 ,合成 潜在 的 目标 形状 ， 并 在 
图 像 中 进行 匹配 、 分 割 和 形成 最 接近 的 目标 结构 。 

为 什么 会 有 这 样 的 情况 出 现 呢 ? 心理 学 中 ， 有 个 叫 格式 塔 (Gestalt ) 
心理 学 的 流派 分 析 过 这 一 现象 ， 并 将 其 归结 为 涌现 ( emergence ) 2, 

在 其 框架 下 ， 感知 到 一 只 达尔 马 提 亚 狗 ( 俗称 六 点 狗 ) 正在 茂盛 的 树 
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下 嗅 着 地 面 的 过 程 称 为 涌现 。 但 与 常规 的 图 像 分 割 不 同 ， 人 在 辨识 这 只 狗 
时 ， 并 不 是 通过 先 找到 它 的 每 个 局 部 结构 如 腿 、 耳 杀 、 鼻 子 、 尾 巴 等 ， 再 
将 其 拼 成 整体 来 推断 狗 的 ; 而 是 将 那些 与 广 点 狗 相 关 的 黑 点 作为 一 个 整体 ， 
一 次 性 地 感知 成 狗 。 然 而 ， 格 式 塔 心理 学 也 只 是 描述 了 这 一 现象 ， 并 没有 
解释 这 个 涌现 是 如 何在 大 脑 中 形成 的 。 

一 种 可 能 的 解释 是 ， 人 会 根据 自己 习 得 的 经 验 来 分 析 图 像 ， 并 尽 可 能 
与 自己 的 经 验 匹 配 。 数 学 上 ， 称 这 种 经 验 为 先 验 知识 。 比 如 当 遇 到 毫 无 线 
索 的 图 像 时 ， 人 会 优先 根据 先 验 知识 或 暗示 来 寻找 最 接近 的 答案 。 于 是 ， 
你 便 可 以 从 图 4.1 中 看 到 一 只 “斑点 狗 ” 了 。 

根据 先 验 知识 或 经 验 来 对 图 像 内 容 和 自然 界 的 景色 进行 想象 和 判断 的 
例子 不 在 少数 。 比 如 图 4.4 中 桂林 漓江 的 九 马 画 山 ， 以 及 2017 年 10 月 19 
日 发 现 的 、 因 其 雪茄 形状 而 被 疑 为 外 星人 飞船 的 Oumuamua *f ( 夏威夷 


语 ， 意 思 是 “第 一 信使 ”) 等 


R 


(b) 
图 4.4 根据 经 验 对 图 片 内 容 进行 想象 与 判断 的 实例 
(a) 桂林 九 马 画 山 ; (b) 疑似 为 外 星人 飞船 的 Oumuamua 4 €. 


但 这 种 整体 结构 的 形成 又 恰恰 是 “客观 ”图像 分 割 很 少 能 做 到 的 。 首 先 ， 
人 感知 到 的 “斑点 狗 ” 并 不 符合 图 像 分 割 的 客观 定义 ， 如 同 质 性 、 少 洞 性 、 
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。” 爱 犯错 的 智能 体 


边界 光滑 性 和 差异 性 。 斑 点 狗 与 背景 几乎 是 相同 纹理 的 ， 斑 点 狗 内 部 和 外 
部 的 差异 极 小 ， 边 界 也 不 清晰 ， 甚 至 人 也 很 难 用 唯一 的 边界 轮廓 来 把 斑点 
狗 色 勒 出 来 。 其 次 ,图像 匹 配 的 相似 度 也 不 高 ， 因 为 只 是 形似 ， 并 非 百 分 
之 九 十 的 精确 相似 。 在 计算 机 视觉 中 ， 有 可 能 第 一 时 间 就 被 判断 成 异常 点 
或 因为 低 于 阔 值 而 被 排队 。 即 使 是 将 其 视 为 认证 任务 (verification ， 即 : 非 
此 即 彼 ) 而 非 分 类 任务 ， 识 别 算法 也 不 见得 能 有 多 高 的 准确 定位 能 力 。 再 
次 ， 它 能 形成 的 联想 会 超出 图 像 分 割 本 身 的 范畴 。 图 像 分 割 的 目的 是 纯粹 
的 , 而 联想 却 是 基于 每 个 人 长 年 耳濡目染 构建 的 知识 库 。 所 以 , 才 会 “看 到 ” 
图 上 的 飞船 ， 由 其 比例 大 小 才 会 猜测 非 人 力 可 为 ， 进 而 联想 到 外 星 文明 等 。 

这 种 上 下 文 的 联系 表达 ， 尽 管 已 经 有 一 些 看 图 说 话 (image captioning, 
也 称 图 像 描述 ) 的 研究 成 果 , 但 目前 的 结果 ， 从 人 工 智能 和 计算 机 视觉 角 
度 来 看 ， 都 还 没 法 与 人 类 抗衡 。 因 为 ， 他 需要 的 知识 库 更 为 庞大 ， 如 果 只 
靠 枚 举 ， 很 容易 出 现 人 工 智 能 里 、 曾 经 流行 的 专家 系统 中 的 组 合 爆炸 问题 。 

除了 人 的 先 验 知识 能 影响 对 图 像 中 目标 的 判断 外 ， 还 有 一 个 更 为 简单 
的 因素 ， 却 能 严重 影响 人 对 目标 的 判断 ， 下 回 书 表 。 
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三 @@) 火星 人 脸 的 阴影 


火星 人 脸 

人 类 对 外 星 文明 的 寻找 和 痴迷 自古 就 有 记载 。 所 以 ， 人 们 每 每 看 到 
拍摄 于 外 星球 的 上 照片， 必然 会 情绪 激动 ， 试 图 从 中 获取 存在 外 星人 的 蛛 丝 
马 迹 。 

图 5.1 (a) 是 一 张 1976 年 美国 “海盗 1 号 ”火星 探测 器 在 火星 “ 西 多 
尼 亚 ” 地 区 拍摄 的 照片 。 如 果 直 接 对 图 做 分 析 ， 即 使 用 到 上 文 讲 过 的 先 验 
知识 ， 也 不 容易 发 现 有 用 信息 。 

不 过 ， 图 像 处 理工 作者 多 少 懂 点 PS (PRI, Photoshop 软件 的 简称 ), 
会 对 图 像 先 做 些 处 理 。 首 先 ， 这 张 图 像 偏 暗 ， 先 增加 图 像 的 整体 亮度 ， 得 
到 图 5.1 (b )。 其 次 ， 早 期 火星 探测 器 拍摄 的 照片 易 受 设备 或 其 他 电磁 干扰 
影响 ,会 在 图 像 上 产生 一 些 白 点 和 黑 点 ， 即 图 像 界 俗称 的 “ 盐 ” 和 “胡椒 ” 
组 成 的 椒盐 噪声 ， 如 图 5.1 (b) 所 示 。 因 为 这 类 噪声 处 在 图 像 像素 亮度 值 
的 两 个 极端 , “胡椒 ” 对 应 ”对 应 于 255， 所 以 比较 容易 通过 图 像 
处 理 技术 消解 。 比 如 将 3 x 3 图 像 块 的 亮度 值 按 大 小 排序 后 取 中 间 值 ， 即 得 
到 图 5$.1 Cc) ME 5.1 (c) 的 亮度 过 于 集中 在 灰色 区 域 ， 需 要 用 相应 的 技 
术 将 图 像 亮度 的 变化 幅度 或 动态 范围 扩大 ， 以 便于 人 类 更 方便 感知 其 中 的 


爱 犯错 的 智能 体 


差异 ， 于 是 有 了 广 为 流 传 的 图 351 (d) s Ce). 


(c) (d) 
图 5.1 火星 人 脸 的 图 像 处 理 过 程 


图 5.1 (e) 是 曾经 很 著名 的 “火星 人 脸 ”。 据 小 道 消息 ， 当 年 苏联 的 一 
群 科学 家 从 美国 宇航 局 公开 的 网 站 上 拿 到 一 组 火星 照片 ， 对 原始 图 片 进 行 
类 似 的 处 理 后 便 得 到 了 这 张 照片 。 仔 细 看 了 后 ， 大 家 非常 激动 ， 因 为 图 上 
有 一 张 看 似 立 体 的 人 脸 ， 眼 睛 、 鼻 子 、 嘴 巴 都 非常 逼真 。 可 是 按 拍摄 的 距 
离 和 目标 比例 来 估计 ， 显 然 不 可 能 是 人 力 可 为 之 ， 更 何况 有 记载 的 人 类 文 
明 还 从 未 有 人 去 过 火星 。 他 们 便 推测 这 可 能 是 外 星人 留 下 的 遗迹 。 尽 管 美 
国 宇 航 局 一 直 强 调 ， 这 只 是 光学 和 图 像 后 处 理 的 视觉 错觉 ， 但 在 当时 ， 这 
种 强调 被 认为 是 刻意 掩盖 外 星 文明 的 阴谋 论 。 

从 那 时 开始 ， 媒 体 对 火星 人 的 幻想 一 直 持 续 不 断 ， 前 前 后 后 拍 过 的 经 
典 电影 不 少 。 有 与 火星 人 发 生 战 争 的 《火星 人 玩 转 地 球 》( 1996 4E ) A KH 
界 之 战 》( 2005 年 )， 也 有 幻想 和 平 相 处 的 ， 如 2000 年 拍摄 的 、 围 绕 火 星 
人 脸 和 火星 文明 展开 的 《火星 任务 六 

为 了 能 “ 走 近 科学 ”, 答疑 解 惑 , 美国 宇航 局 后 来 又 做 了 几 次 火星 探索 。 
1998 年 、2001 年 和 2006 年 对 火星 人 脸 位 置 进行 了 再 次 侦 测 。 从 发 回 的 照 
片 看 ,“ 火 星人 脸 ” 只 是 一 座 普通 的 山 丘 ， 图 5.2 展示 了 1976 年 、2001 年 、 
2006 年 火星 人 脸 照 片 对 比 。 但 由 于 当时 火星 正 值 多 云天 气 ， 照 片 效果 不 佳 ， 
大 众 并 不 认可 其 结论 。2015 年 7 月 ， 欧 洲 宇航 局 “火星 快车 ”探测 器 飞越 
火星 “人 脸 ” 上 空 时 ， 拍 下 几 幅 高 清晰 照片 。 其 拍摄 的 三 维 成 像 照片 清楚 
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简单 视觉 错觉 


地 呈现 了 火星 人 脸 的 地 形 。 它 表明 在 其 他 角度 观察 “火星 人 脸 ” 时 ， 上 面 
并 没有 任何 人 脸 的 特征 ， 只 是 大 自然 腐蚀 的 结果 而 已 。 


(c) 
图 5.2 1976 4F (a) , 2001 (b) 49 2006 4E (c) 不同 火星 探测 器 拍摄 的 火星 人 
脸 对 比 


通过 这 些 努 力 ， 多 少 打消 了 大 家 对 火星 人 的 幻想 。2015 年 的 电影 《 火 
星 救援 》 更 是 把 火星 描绘 成 荡 无 人 烟 的 沙漠 。 主 人 公 马 克 因 意外 不 得 不 独 
自在 火星 上 生存 ， 在 绝对 的 孤独 中 只 能 靠 刺激 感官 的 摇滚 乐 和 迪斯科 音乐 
来 振作 精神 。 比 如 ， 他 在 改装 战神 四 号 准备 逃离 火星 时 ， 听 着 与 披 头 士 齐 
名 的 瑞典 国宝 级 乐队 一 一 ABBA 乐队 1974 年 的 成 名 曲 "“Waterloo"( 滑铁卢 )。 

Ait, 20184F7 25 日 ,美国 科学 杂志 报道 ， 意 大 利 科学 家 利用 地 
于 穿 透 雷达 在 火星 南极 冰 盖 下 发 现 了 巨大 的 地 下 湖 ， 又 让 人 们 对 火星 生命 
产生 了 新 的 希望 和 联想 。 

然而 ， 不 管 有 没有 火星 人 ,“ 火 星人 脸 ” 的 视觉 错觉 来 源 于 两 个 因素 ， 
一 是 人 对 人 脸 的 先 验 知识 ， 另 一 个 是 阴影 帮助 人 们 建立 的 立体 视觉 。 


阴影 
阴影 是 日 常生 活 最 常见 的 。 太 阳 升 起 来 , 照 在 桑 十 河上 ”, 河 边 的 景物 
便 有 了 影子 。 


@ 《太阳 照 在 桑 干 河上 》 是 著名 作家 丁玲 于 1956 年 在 人 民 文 学 出 版 社 出 版 的 图 书 。 
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爱 犯错 的 智能 体 


一 般 来 说 ， 阴 影 有 4 类 ， 
如 图 5.3 所 示 中 。 光 照 在 物 
体 上 ， 被 物体 完全 遮挡 在 地 
面 形 成 的 阴影 称 为 全 影 (cast 
shadow ) ; 由 于 光源 大 小 差异 
在 全 影 以 外 形成 的 阴影 称 为 

图 5.3 阴影 的 形成 与 分 类 中 半 影 (penumbra ) ; 物体 表面 
因 光 源 变化 而 导致 光 的 强 弱 
变化 ， 未 被 谈 挡 部 分 称 为 阴影 ( shading )， 而 被 遮挡 部 分 称 为 附着 阴影 
(attached shadow )。 男 外 ， 如 果 把 阴影 的 类 型 作为 课堂 习题 ， 学 生 回 答 
不 上 来 拿 不 到 分 数 的 时 候 ， 说 不 定 还 会 增加 一 个 心理 阴影 。 
阴影 对 人 的 认 知 、 人 工 智能 的 发 展 有 着 不 可 忽视 的 影响 ， 利 次 共 存 。 

首先 ， 人 对 阴影 的 认 知 并 非 与 生 俱 来 的 。1~2 岁 的 小 孩 发 现 脚下 连 着 
个 影子 时 ， 并 不 会 马上 明白 这 只 是 光学 现象 ,不 是 实体 ， 反 而 可 能 会 因为 
甩 不 掉 而 产生 短暂 的 恐惧 感 。 成 语 中 的 “ 杯 马 蛇 影 ”也 反映 了 影子 对 心理 
认 知 的 影响 。 那 么 , 未 来 的 机 器 人 能 赋予 这 种 “心理 阴影 ”的 认 知 能 力 吗 ? 

其 次 ， 阴 影 的 存在 为 人 类 识别 目标 的 大 小 、 远 近 、 运 动 方 向 和 数量 等 
提供 了 参考 ， 好 的 、 坏 的 都 有 。 它 对 许多 人 工 智能 的 实际 应 用 也 造成 了 不 
小 的 障碍 。 

举例 来 说 ，2018 年 3 月 的 首 例 无 人 驾驶 车 撞 人 致死 事件 就 与 之 有 一 定 
关系 ， 如 图 5.4 所 示 。 从 美国 优 步 (Uber) 公司 公开 的 事故 报告 来 看 ， 当 
时 优 步 无 人 驾驶 车 上 的 驾驶 员 把 激光 雷达 测 距 仪 关 掉 了 ， 结 果 使 得 无 人 驾 
驶 车 仅 依赖 摄像 头 获 取 的 图 像 来 实现 自主 驾驶 。 由 于 夜幕 对 驾驶 周边 环境 
形成 的 巨大 阴影 ， 推 车 的 受害 者 在 出 现 前 被 完全 掩蔽 在 黑暗 中 。 分 析 的 结 
果 表 明 ， 虽 然 视频 中 人 被 检测 出 来 了 ， 但 低 于 阔 值 。 不 过 ， 报 告 没 有 提 及 
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在 阴影 中 人 是 否 被 检测 出 来 。 这 些 情 况 多 少 说 明了 ， 阴 影 的 存在 ， 使 得 智 
能 各 驶 系统 在 判断 目标 是 否 为 行人 时 的 确定 性 显著 降低 了 。 
由 于 确定 性 的 降低 ， 再 等 到 被 害 者 从 阴影 中 走出 后 ， 系 统 没 能 输出 紧 


èl 
E 


,刹车 的 指令 ， 最 终 导致 了 惨剧 的 发 生 。 这 次 事故 也 直接 影响 到 整个 无 人 / 
智能 驾驶 行业 的 研究 。 


阴影 对 目标 的 跟踪 和 计数 的 干扰 也 很 严重 。 如 图 5.5 (a ) 中 ， 如 果 不 
能 将 车 辆 和 其 阴影 分 离 ， 智 能 驾驶 就 无 法 精确 定位 车 辆 、 车 形 和 测 距 P9. 
再 如 图 5.5 (b) 的 计数 问题 ， 如 果 缺 乏 好 的 阴影 抑制 或 去 除 算 法 ， 则 会 影 
向 对 羊 群 的 准确 计数 ， 进 而 可 能 影响 某 些 人 或 智能 机 器 人 的 “睡眠 ”， 因 为 
“ 数 羊 ”一 直 是 治疗 失眠 的 方法 之 一 ， 不 管 是 否 有 效 。 而 “睡眠 ”对 智能 体 
的 学 习 也 尤其 重要 ， 这 是 后 话 ， 和 暂且 不 表 。 
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TO 爱 犯 错 的 智能 体 


(a) 


E55 阴影 对 目标 跟踪 和 计数 的 干扰 
(a) 未 进行 阴影 抑制 的 车 辆 检测 UU. (b) 阴影 与 羊 群 计数 


但 是 ， 目 前 的 阴影 分 离 和 去 除 仍 没有 特别 好 的 人 工 智能 和 计算 机 视觉 
算法 中。 有 学 者 将 阴影 和 实际 图 像 看 成 是 两 个 独立 变量 ， 利 用 可 以 从 混合 
信息 中 分 离 出 独立 变量 的 独立 分 量 分 析 (independent component analysis ) 
的 技术 来 过 滤 和 分 离 阴影 ,也 有 学 者 希望 借 颜 色 恒 常 性 来 设计 算法 去 除 阴 
影 呈 0。 最 近 的 深度 学 习 技 术 ， 有 考虑 采用 深度 卷 积 网 中， 也 可 以 考虑 采 
用 “图 像 + 编辑 ”的 思路 ， 通 过 生成 式 对 抗 网 络 或 自 编码 网 络 来 去 除 阴影 。 
然而 ， 由 于 阴影 的 多 样 性 ， 要 构造 阴影 去 除 的 终极 算法 并 不 容易 。 更 何况 ， 
这 项 研究 在 人 工 智 能 和 计算 机 视觉 领域 本 就 属于 小 众 研究 。 

另外 ， 去 除 阴 影 也 并 非 都 是 好 的 ， 因 为 阴影 会 帮助 人 们 形成 立体 视觉 ， 
以 及 对 观测 目标 的 距离 形成 正确 判断 。 在 这 种 情况 下 ， 过 滤 或 消除 阴影 
能 导致 危险 的 后 果 ， 尤 其 在 智能 驾 台中 。 比 如 图 5.6 中 ， 阴 影 的 位 置 可 以 
让 人 对 目标 的 空间 位 置 产 生 明 显 不 同 的 判断 。 如 果 没 有 阴影 ， 就 很 难 猜测 
纸 到 底 是 W 形状 还 是 M 形状 了 I. 


QD 颜色 恒 常 性 color constancy) 是 指 当 照 射 在 物体 表面 的 颜色 光 发 生变 化 时 ， 人 们 对 于 该 
物体 表面 上 的 颜色 知觉 仍然 保持 不 变 的 知觉 特性 ， 比 如 阴影 ， 虽 然 会 导致 颜色 变化 ， 但 不 影 
响 颜 色 恒 常 性 。 
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简单 视觉 错觉 。 


正 是 出 于 阴影 能 提供 立体 视觉 的 原因 ， 我 国 嫦娥 四 号 探测 器 也 特意 选 
择 了 月 球 的 白天 时 间 ， 于 2019 年 1 月 3 日 10 时 26 分 成 功 着 陆 在 月 球 背 1 
东经 177.6” . PAZ 45.5° 附近 、 南 极 - 艾 特 肯 贫 地 内 的 汉 卡门 撞击 坑内 。 
其 原因 在 于 ， 着 陆 点 选 在 背面 ， 导 致 地 面 上 的 信号 必须 通过 中 继 卫 星 来 引 
导 探 测 器 的 行动 ， 这 会 有 60 秒 的 延迟 ， 而 整个 着 陆 过 程 才 700 秒 不 到 。 另 
外 ， 芯 特 上 表 分 地 地 形状 比较 复杂 、 崎 贝 ， 撞 击 坑 大 上 是 分 布 密集 ， 最 大 落差 
高 达 16.1km。 这 些 都 要 求 探测 器 必需 具有 更 稳健 的 自 适应 调整 能 力 。 当 月 
球 背 面 进入 白天 、 太 阳光 照 在 月 球 的 角度 达到 理想 状态 时 ， 着 陆 点 及 周围 
的 地 貌 将 能 够 提供 相对 清楚 的 阴影 (图 5.7 )， 为 嫦娥 四 号 探测 器 的 辅助 光 
学 设备 提供 更 有 效 的 立体 视觉 ， 从 而 实现 精确 的 地 形 和 高 程 图 分 析 及 判断 ， 
保障 探测 器 的 安全 着 陆 。 

有 趣 的 是 ， 虽 然 阴 影 如 此 有 用 ， 但 是 并 非 全 部 阴影 类 型 都 被 用 于 绘画 


Em 


图 5.6 笔 的 阴影 对 折纸 结构 的 帮助 中 图 5.7 “ERDF” MASA 
四 号 探测 器 走出 ， 走 上 月 面 
的 影像 图 及 巡视 器 在 月 球 表 
面 的 阴影 (图 来 自 中 国 国家 
航 天 Ej http//www.cnsa.gov. 
cn/n6759533/c6805086/content. 
html ) 


E 

艺术 。 在 绘画 中 ， 用 的 最 广泛 的 是 材料 本 身 形成 的 阴影 ， 而 能 反映 物体 运 
动 和 时 间 变 化 的 全 影 则 较 少 被 使 用 。 雅 各 布 森 ( Jacobson ) 和 沃 纳 ( Werner ) 
曾 分 析 了 大 量 古 代 的 绘画 作品 ， 发 现 有 两 幅 表现 这 些 变化 的 作品 Ot, an 
图 5.8 所 示 ， 一 幅 是 乔治 德 . IRE (Giorgio de Chirico ) 画 的 《正午 的 
教堂 > 作者 用 长 长 的 阴影 配合 明亮 、 正 午 的 天 空 来 形成 永恒 (timelessness ) 
的 感觉 。 一 幅 是 马 萨 乔 ( Masaceio ) 夯 的 《耶稣 门徒 犹大 的 故事 》。 他 将 犹 
大 走路 时 形成 的 阴影 画 成 透明 的 ， 通 过 覆盖 在 路 边 信徒 的 身上 来 表达 圣经 
中 曾经 描述 过 的 神 迹 : 犹大 经 过 的 地 方 ， 路 边 虔诚 信徒 的 顽疾 会 不 治 而 愈 。 


图 5.8 正午 的 教堂 (乔治 ， 德 ， 基 里 科 ) (a) ; 圣 徒 犹大 用 他 的 阴影 治愈 门徒 的 
故事 (LPR) (b) 


尽管 全 影 能 提供 目标 的 运动 信息 ， 雅 各 布 森 和 沃 纳 认 为 这 一 信息 很 难 
在 绘图 中 被 表现 出 来 ， 因 而 全 影 在 绘画 中 是 可 有 可 无 的 (expendable ) "1。 

类 似 的 ， 在 人 工 智能 和 计算 机 视觉 领域 ， 基 于 静态 阴影 的 研究 相对 多 
些 , 但 基于 阴影 的 变化 来 估计 目标 的 距离 、 形 状 、 运 动 速度 等 的 文章 则 少 
了 很 多 。 考 虑 到 它 能 提供 丰富 的 辅助 信息 ， 相 信 未 来 会 有 更 多 的 学 者 会 把 
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简单 视觉 错觉 。 


动态 阴影 的 分 析 加 入 人 工 智能 的 研究 中 。 

人 工 智 能 战争 下 的 仿生 与 阴影 

阴影 对 自然 界 的 生物 也 很 重要 。 以 昆虫 为 例 ， 多 数 昆 虫 的 背 壳 往往 比 
其 腹部 要 黑 得 多 。 当 其 停 在 某 处 时 ， 暗 的 背 壳 朝 外 ， 更 靠近 光 ， 形 成 的 阴 
影 可 以 有 效 掩盖 其 腹部 体征 。 按 格式 塔 统一 论 ， 在 这 种 情况 下 ， 昆 虫 就 变 
成 一 个 整体 ， 其 立体 感 消失 ， 变 得 完全 不 像 一 个 固体 的 、 三 维 的 “东西 ”， 
从 而 达到 伪装 的 效果 Ot 

这 一 特性 实际 上 也 可 以 为 军事 领域 的 间谍 和 窃听 昆虫 所 利用 。 尤 其 在 
不 久 的 将 来 ， 随 着 人 工 智能 研究 的 快速 发 展 ， 未 来 仿生 机 器 人 的 体积 将 会 
更 加 微型 化 。 

那么 ， 要 发 现 这 类 仿生 机 器 人 ， 最 直接 的 办 法 就 是 设法 还 原 甚 至 放大 
其 原 有 的 立体 感 。 一 个 简单 的 办 法 就 是 利用 光线 的 变化 来 主动 重建 阴影 。 
本 人 常 受 蚊 虫 困 扰 ， 不 堪 之 余 就 会 用 强 光 手电 简 来 寻找 隐藏 在 床 角 、 椅 爹 
下 的 蚊子 ， 屡 试 不 三。 原因 也 简单 ， 强 光 能 破坏 蚊子 的 “阴影 ”， 还 原 其 立 
体 结构 ， 甚 至 可 以 放大 蚊子 的 尺寸 。 同 时 ， 通 过 变化 强 光 的 角度 ， 能 反 向 
形成 蚊子 阴影 的 伪 “ 运 动 "， 从 而 使 蚊子 无 所 通 形 。 成 功 消 灭 蚊子 的 时 候 ， 
偶尔 也 会 想 想 ， 如 果 能 将 其 重建 阴影 和 阴影 运动 的 过 程 自动 化 ， 说 不 定 就 
能 用 于 未 来 人 工 智能 战争 下 的 反 窍 听 、 反 侦察 。 这 种 方法 的 好 处 是 不 用 增 
加 昂贵 且 复 杂 的 设备 ， 简 单 易 行 ， 而 随后 的 微小 目标 识别 只 需 用 常规 的 目 
标 检 测 技术 即 可 实现 。 

不 难看 出 ， 阴 影 对 人 类 的 认 知 和 人 工 智 能 都 有 着 很 重要 的 作用 ， 但 要 
利用 好 它 却 并 非 易 事 。 除 了 阴影 外 ， 还 有 什么 简单 因素 ， 也 会 让 爱 犯 错 的 
智能 体 继续 犯错 呢 ? 


爱 犯错 的 智能 体 


三 (@) 外 国 的 月 亮 比较 圆 


每 逢 中 秋 佳 节 ， 和 家 人 一 起 一 边 赏 月 ， 一 边 吃 着 五 仁 月 饼 ， 真 是 其 乐 
融融 。 赏 月 的 时 候 ， 有 时 会 禁不住 想起 这 名 “外国 的 月 亮 比较 圆 "， 然 后 会 
引申 出 各 种 崇洋 媚外 的 批判 感悟。 

到 底 是 不 是 外 国 的 月 亮 比较 圆 呢 ? 2015 年 9 月 27 日 中 秋 节 ， 广 东 天 
文学 会 就 指出 ， 当 年 那天 的 中 秋月 会 与 超级 月 亮 和 月 全 食 现象 相继 出 现 ， 
会 出 现 平均 九 年 一 次 的 最 大 最 圆 的 中 秋月 0。 不 过 遗憾 的 是 ， 只 有 南美 洲 、 
北美 洲 东 部 和 非洲 西部 能 看 到 月 全 食 并 欣赏 最 大 红 月 亮 ， 而 在 中 国 则 无 法 
看 到 。 那 一 天 ， 外 国 的 月 亮 又 圆 又 大 。 

但 在 多 数 情况 下 ， 月 亮 到 地 球 的 距离 从 不 同 地 点 来 看 差异 不 大 ， 不 管 
是 用 经 纬 仪 测量 还 是 拍照 后 比较 ， 月 亮 的 大 小 除了 轻微 的 物理 变化 外 ， 相 
差 无 几 。 视 觉 上 产生 这 种 感觉 只 是 心理 因素 而 已 。 

月 亮 错觉 

虽然 “外 国 的 月 亮 比 较 圆 ”并 不 成 立 ， 但 在 月 升 月 落 之 间 ， 人 对 月 亮 
@ 2015 年 9 月 28 日 出 现 了 超级 月 亮 。 超级 月 亮 是 指 月 球 围绕 地 球 运行 至 近地点 时 的 状态 ， 
从 地 球 上 看 ， 月 亮 要 大 一 些 ， 且 亮度 要 比 普 通 月 亮 高 30%。 而 9 月 28 日 上 午 10 时 左右 还 出 


现 了 月 全 食 。 此 现象 发 生 于 月 球 、 地 球 和 太阳 刚好 完全 在 一 条 直线 时 。 由 于 地 球 遮 挡 太 阳光 
线 的 原因 ,月亮 会 完全 进入 地 球 的 影子 , 呈现 红 月 亮 的 样子 。 而 2015 年 9 月 27 日 则 是 中 秋 节 。 
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大 小 的 心理 感知 确实 存在 差异 。 最 明显 的 例子 是 ,月亮 在 地 平 线 上 会 比 悬 
在 天 空 看 上 去 更 大 一 些 ， 这 俗称 “月 亮 错觉 ”( moon illusion )。 虽 然 这 并 非 
真正 的 月 亮 大 小 问题 ， en 的 大 小 差异 仍 是 一 个 未 解 之 谜 。 
追踪 下 文献 不 难 发 现 ， 、 研 究 过 “月 亮 错觉 ”的 人 还 真 不 少 。 

对 国人 来 说 ， cell me MERE. 他 在 1484 年 12 8 
的 时 候 写 过 一 首 很 有 名 的 小 诗 ,《 蔽 月 山 房 六 这 首 诗 就 记录 了 他 对 月 亮 错 
觉 的 感受 。 

山 近 月 远 觉 月 小 ， 便道 此 山大 于 月 。 

若 有 人 了 眼 大 如 天 ， 当 见 山高 月 更 阔 。 

而 国外 则 对 这 一 现象 有 着 长 期 的 分 析 和 思考 ， 最 早 可 以 追溯 到 公元 
前 4 世纪 。 和 希腊 著名 哲学 家 亚 里 士 多 德 曾 记录 过 ， 他 认为 “月 亮 在 地 平 
线 比 天 上 大 ”是 因为 地 球 的 大 气 起 到 了 放大 的 作用 ， 导 致 人 眼 产生 了 感知 
错觉 UN 

基于 距离 远近 理论 的 最 早 解释 是 克 莱 奥 迈 季 斯 ( Cleomedes ) 在 大 约 公 
元 200 年 时 提出 的 外。 他 认为 地 平 线 上 的 月 亮 大 是 因为 其 看 上 去 显得 更 远 。 
在 地 平 线 的 角度 上 ， 人 能 够 参照 其 他 物体 的 大 小 来 感受 月 亮 的 大 小 。 而 在 
天 顶 时 ， 则 没有 其 他 参照 物 可 以 借用 ， 于 是 就 会 觉得 天 上 的 月 亮 离 地 球 要 
近 一 些 ， 因 而 会 觉得 比 地 平 线 上 的 月 亮 更 小 。 

1813 年 ， 叔 本 华 ( Schopenhauer ) 认为 这 种 错觉 是 大 脑 的 行为 而 非 光 
学 原因 。 他 认为 大 脑 的 直觉 感知 理解 ， 会 把 水 平角 度 的 每 一 个 目标 都 “看 ” 
得 比 垂直 方向 的 更 遥远 ， 因 而 会 觉得 更 大 。 

1962 年 两 位 科学 家 考 夫 曼 (Kaufman) 和 罗 克 (Rock) 进行 了 一 个 重 
要 的 实验 , 验证 了 月 亮 错觉 模式 与 距离 之 间 的 关系 , 称 为 “ 庞 邹 错觉 " Ponzo 
illusion), WA 6.1 Stax. MA 6.1 可 以 看 出 ， 当 目标 具有 相同 大 小 , 但 
放 在 更 远 处 时 ， 随 着 视角 的 变 罕 或 靠近 消逝 点 ， 远 处 的 目标 会 显得 更 大 。 


爱 犯错 的 智能 体 


举例 来 说 ， 如 果 将 两 个 相同 大 小 的 苹果 分 别 放置 在 Sm 和 10m 的 位 置 ， 后 
者 的 视角 感觉 比 前 者 小 一 半 ， 但 感觉 上 不 会 觉得 后 者 的 尺寸 小 一 半 ， 而 会 
是 相同 大 小 。 相 反 ， 如 果 更 远 的 目标 与 近 的 目标 具有 相同 的 视角 ， 则 视觉 
上 会 感觉 前 者 是 后 者 的 两 倍 。 

另 一 种 解释 是 相对 尺寸 假设 ， 如 图 6.1 所 示 。 月 亮 在 地 平 线 时 ， 其 令 
近 的 目标 往往 能 展示 更 精致 的 细节 ， 使 得 月 亮 看 上 去 显得 更 大 。 相 反 ， 天 
项 的 月 亮 会 被 大 范围 空 的 空间 包围 着 ， 因 而 显得 更 小 。 这 个 效果 又 被 称 为 
“ 艾 宾 浩 斯 错觉 ”( Ebbinghaus illusion ) ©. 

基于 这 样 的 感觉 ， 有些 科学 家 认为 “地 平 线 上 的 月 亮 看 上 去 大 是 因为 
其 感受 的 视角 尺寸 或 物理 尺寸 更 大 ， 或 两 者 均 有 ”。 

人 然而， 基于 距离 理论 的 不 足 在 于 ， 尽 管 大 多 数 人 会 认为 地 平 线 上 的 月 
亮 既 大 又 比 天 顶 的 月 亮 近 ， 大 约 还 有 5% 的 人 会 觉得 地 平 线 上 的 月 亮 既 大 
又 远 ， 还 有 一 些 人 认为 距离 相同 但 地 平 线 上 的 月 亮 更 大 ， 还 有 一 些 人 完全 
没有 月 亮 错觉 上。 


xA 


(a) (b) 
图 6.1 月 亮 错觉 (a) ; 艾 宾 浩 斯 错觉 (b) 


QD 德国 心理 学 家 了 HH. 艾 宾 浩 斯 (H. Ebbinghaus) 还 有 一 个 著名 的 艾 宾 浩 斯 遗忘 曲线 ， 描 述 了 学 
习 新 事物 遗忘 的 规律 。 比 如 背 单 词 ， 要 防止 忘记 ， 就 可 以 按 这 个 遗忘 曲线 来 增强 记忆 。 
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为 了 探寻 真 诺 ， 赫 汉 森 ( Hershenson ) 在 1989 年 主编 了 一 本 书 《 月 球 
figu) PU. GAGA 24 章 288 页 ， 详 细 介绍 了 不 同 错觉 研究 者 从 不 同 
角度 给 出 的 解释 。 然 而 没有 形成 一 致 结论 ， 也 没有 终结 对 月 亮 视觉 大 小 差 
异 的 疑问 。 

人 工 智 能 中 的 透视 问题 

如 果 把 月 亮 大 小 的 感觉 看 成 是 与 心理 因素 相关 的 透视 问题 ， 那 么 需要 
说 明 的 是 ， 这 种 心理 原因 导致 的 透视 错觉 ， 目 前 还 没有 什么 好 的 理论 和 算 
法 去 量化 成 计算 机 程序 并 实现 。 但 在 客观 存在 的 透视 问题 上 ， 研 究 就 多 多 
了 ， 因 为 客观 的 透视 在 很 多 计算 机 视觉 、 图 像 处 理 领域 的 实际 应 用 中 都 有 
着 重要 的 作用 ， 而 这 些 应 用 又 直接 影响 了 人 工 智能 的 相关 研究 。 

比如 人 群 计数 研究 中 池 。 人 群 数 量 能 否 准确 预测 ， 对 于 安防 、 旅 游 景 
点 和 地 铁 应 急 玖 散 、 商 场 商 品 的 位 置 摆 放 等 都 有 着 关键 的 作用 。 但 要 想 有 
效 估计 人 和 群 数量 ， 又 并 非 容 易 的 事情 。 用 手机 来 监控 的 话 ， 全 球 定位 系统 
( global positioning system, GPS ) 定位 信息 的 漂移 现象 往往 会 显著 影响 计数 
性 能 。 尤 其 在 开放 环境 下 ( 如 上 海外 滩 ) 的 人 群 计数 ， 周 边 办 公 大 楼 的 信 
号 都 可 能 导致 误 估 。 而 场馆 内 则 会 出 现 GPS 信号 丢失 的 问题 。 有 人 也 尝试 
用 无 线路 由 器 的 信号 来 监控 馆 内 人 和 群 ， 但 精度 上 无 法 保证 。 更 合理 的 方式 
是 通过 摄像 机 来 获取 图 像 ， 并 对 图 像 或 视频 中 的 人 和 群 进行 计数 。 不 过 ， 摄 
像 头 的 角度 设置 是 有 讲究 的 。 垂 直角 度 如 无 人 机 ， 可 避免 人 与 人 的 遮挡 ， 
但 电池 的 待机 时 间 存 在 问题 ， 而 烧 燃 油 的 又 不 是 一 般 部 门 能 用 的 ， 且 噪声 
巨大 ; 近景 的 如 安装 在 公交 车 站 上 车 处 的 ， 则 会 因为 前 面 的 人 在 视频 中 占 
的 比例 太 大 ， 导 致 视频 范围 内 可 以 计数 的 人 变 得 很 少 ， 实 用 价值 降低 。 中 
等 角度 如 安置 在 楼 宇 屋顶 的 ， 可 观察 的 角度 相对 来 说 更 好 些 ， 适 合 于 较 笛 
密 的 人 群 计数 。 但 由 于 摄像 机 的 角度 问题 ， 远 近 人 群 在 图 像 中 的 比例 会 因 
透视 而 发 生 改 变 ( 图 6.2 )， 如 果 不 纠 正 透视 角 ， 则 可 能 会 影响 随后 的 计数 
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性 能 。 这 是 客观 透视 的 一 个 应 用 。 

另外 ， 在 交通 领域 ， 大 货车 的 侧 方言 区 和 尾部 一 直 是 马路 致死 率 很 高 
的 问题 。 为 减少 它 的 影响 ， 一 些 国家 强制 要 求 在 大 货车 两 侧 安装 广角 镜 ， 
比较 先进 的 广角 镜 还 能 把 盲区 的 视频 信息 返 送 回 驾 驶 室内 。 但 由 于 广角 镜 
透视 变形 的 原因 ， 离 广角 镜 较 远 的 区 域 会 比较 近 的 区 域 在 镜子 上 得 到 更 大 
的 视角 压缩 ， 因 此 ,驾驶 员 容 易 对 行人 和 非 机 动车 驾驶 员 离 车 辆 的 远近 、 
运动 速度 产生 误 判 。 此 时 ， 就 需要 有 相应 的 算法 来 帮助 还 原 真 实 的 距离 和 
运动 速度 了 ， 以 减少 不 必要 的 风险 。 

除 此 以 外 ， 在 计算 机 视觉 领域 还 有 人 研究 基于 图 像 的 测 距 问 题 。 这 一 
问题 在 智能 手机 流行 后 似乎 研究 意义 更 大 了 。 科 学 家 们 希望 能 对 给 定 的 图 
像 或 视频 ， 不 依赖 于 真实 的 测量 仪 ( 如 米 尺 ) 就 能 直接 测量 出 图 中 的 目标 
尺寸 和 目标 间 的 相互 距离 *。 这 一 研究 ， 显 然 也 涉及 透视 关系 以 及 透视 
意义 下 的 比例 问题 求解 (图 6.3 ). 


图 6.2 人 和 群 计数 中 的 透视 问题 由 图 6.3 基于 图 像 的 测 距 研究 示例 Ul 
此 图 由 安装 在 五 层 楼 高 度 的 摄像 机 拍 ( lin=0.0254m ) 


摄 ， 对 远近 的 人 的 大 小 有 透视 变形 


透视 角度 对 心境 的 影响 
情绪 、 情 感 对 人 工 智能 的 研究 至 关 重要 ， 因 为 它 关系 到 是 否 能 真正 通 
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过 计算 机 模拟 出 一 个 真正 像 人 的 机 器 ， 而 非 看 上 去 像 。 那 么 ， 如 何 形 成 、 
在 哪里 能 形成 这 种 情绪 、 情 感 就 需要 仔细 思考 了 。 

透视 角度 的 选择 对 心境 能 表现 出 很 复杂 的 影响 ， 尤 其 在 高 层 语义 上 。 
所 以 ， 画 家 对 于 透视 角度 的 选择 看 得 很 重 ， 因 为 它 影响 了 人 们 评判 绘画 作 
品 的 美感 。 要 让 人 工 智能 像 人 类 一 样 能 创作 ， 攻 破 艺 术 这 个 关口 ， 可 能 也 
得 好 好 研究 一 下 透视 对 心境 的 影响 。 

我 们 不 妨 回顾 一 下 人 工 智 能 科普 奇 书 《 哥 德尔 ， 艾 舍 尔 ， 巴 赫 一 一 集 


Escher ) 的 创作 经 历 ， 以 及 他 对 透视 的 运用 。 

学 画 都 是 从 临摹 开始 的 。 后 来 ， 艾 舍 尔 为 了 能 让 自己 的 绘画 有 与 众 不 
同 的 感受 ， 他 对 透视 角 有 过 非常 深 的 思考 。 这 能 从 他 不 同时 期 的 绘画 作品 
rpg eae 98 

最 初 ， 他 喜欢 
去 山顶 绘画 ,希望 得 
到 俯 敬 视角 下 的 景 
色 描 绘 ; 后 来 ， 他 改 
成 了 从 窗户 往外 看 ， 
窗 内 窗外 的 透视 又 
形成 了 一 组 奇特 视 
角 的 画 ， 如 其 1937 
年 那 件 著名 的 将 面 
中 的 街道 和 自己 的 
Bs — RBS AKZaMER CHARGE SE) 图 6.4 (a)) 以 及 1935 年 的 自 
画像 一 一 《手持 球面 镜 》( 图 6.4(b ))。 有 了 自画像 后 , 他 似乎 找到 了 循环 ， 
便 有 了 许多 与 循环 相关 的 杰作 。 对 透视 角 的 不 断 深 思 ， 最 终 让 他 成 为 了 以 


B64 窗 内 视角 的 木刻 《静物 和 街景 》(a) ; LER 
的 版 画 《 手 持 球面 镜 》 (b) 
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“不 可 能 图 形 ”而 闻名 的 一 代 和 名 画家 。 

透视 角 不 仅 能 影响 审美 ,产生 奇妙 
的 美感 ， 它 也 能 制造 恺 惧 。 在 2018 年 最 
新 上 有 映 的 韩国 恺 怖 片 《 昆 池 岩 》 导演 别 
出 心 裁 地 采用 了 ”第 一 "视角 的 方式 拍摄 。 
电影 中 ，6 名 演员 均 在 胸 前 安装 了 两 个 
运动 相机 ， 一 个 对 着 自己 脸 部 ， 一 个 对 
着 自己 观测 的 环境 。 由 于 镜头 与 人 脸 的 
距离 非常 近 ， 对 着 自己 脸 部 的 相机 让 演 
员 的 脸 产生 了 明显 的 拉 伸 变形 。 因 为 变 
形 后 的 脸 与 正常 脸 有 明显 的 差异 ， 无 形 
中 将 人 的 表情 尤其 是 惊悚 的 表情 放大 了 ， P 
使 得 电影 的 恐怖 感 一 下 就 上 升 几 个 级 别 。 图 6.5 柯 尼斯 卷 毛 猫 近景 昭 
这 是 透视 角度 对 人 内 在 情绪 的 影响 。 因 
为 过 于 恐怖 ， 我 就 换 张 类 似 的 图 给 大 家 感受 一 下 好 了 (图 6.5 )。 

所 以 ， 透 视 对 人 在 心理 、 距 离 、 情 绪 等 方面 都 有 着 重要 的 影响 ， 也 有 
着 与 人 工 智 能 相关 的 许多 实际 应 用 。 可 是 ,要 解 开 透 视 中 的 谜团 ， 尤 其 是 
主观 透视 现象 ， 将 其 体现 到 人 工 智 能 的 算法 中 ， 还 是 路 漫漫 其 修 远 分 。 
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=@ 眼中 的 黎 曼 流 形 与 距离 错觉 


导读 : 本 篇 介绍 的 内 容 与 2018 年 麦 动 一 时 的 黎 曼 猜想 “ 破 

解 ”新 闻 无 关 ， 是 想 探讨 一 下 黎 曼 主攻 的 几何 学 与 人 工 智能 

的 关系 ， 是 讨论 视觉 中 的 距离 错觉 。 

2018 年 9 月 24 日 中 秋 节 这 天 ， 朋 友 圈 在 疯 传 黎 曼 猜想 被 破解 的 消息 : 
BEO, SJEKKA NRK, 但 已 年 近 90 的 数学 家 迈克 尔 ， 阿 蒂 亚 
贴 出 了 其 证 明 。 因 为 黎 曼 猜想 是 一 百 多 年 前 数学 家 硕 尔 伯 特 列 出 的 23 个 数 
学 最 难 问 题 之 一 ， 也 是 现今 克 雷 数学 研究 所 悬赏 的 世界 七 大 数学 难题 之 一 ; 
因为 它 可 能 揭示 素数 的 分 布 规律 ， 也 因为 可 能 影响 现 有 密码 学 的 研究 ， 大 
家 都 很 亢奋 。 不 过 从 众多 评论 来 看 ， 这 个 尝试 可 能 不 得 不 遗憾 地 说 不 是 太 
成 功 。 但 考虑 到 阿 蒂 亚 年 事 已 高 ， 估 计 没 谁 敢当 面 驶 他 。 尽 管 如 此 ， 老 先 
生 老 怠 伏 杞 、 志 在 千里 的 钻研 精神 还 是 值得 我 辈 学 习 的 。 

作为 此 猜想 的 提出 者 ， 黎 曼 可 能 压根 也 没 想到 自己 的 猜想 能 对 100 多 
年 后 的 密码 学 有 所 帮助 。 因 为 研究 素数 在 “科学 的 皇后 ”一 一 数学 里 被 认 
为 是 最 纯 的 数学 ， 是 与 应 用 毫 无 关系 的 数学 。 这 种 纯 性 让 数论 成 为 了 “ 数 
学 的 皇后 "。 所 以 ,正常 情况 下 ， 数 学 的 吉 视 链 是 不 允许 他 去 推测 素数 分 布 


O FH: 是 与 “ 民 科 ”一 词 相对 而 言 ， 指 在 大 学 、 研 究 所 等 科研 机 构 任 科研 职位 的 科研 人 员 。 
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在 密码 学 中 的 应 用 的 。 据 说 ， 站 在 数学 鄙视 链 顶 端的 纯 数学 研究 者 ， 通 常 
是 看 不 起 学 应 用 数学 的 ; 而 学 应 用 数学 的 ， 会 看 不 起 学 统计 的 。 在 人 工 智 
能 热潮 下 ， 学 统计 的 又 看 不 起 研究 机 器 学 习 的 ; 而 学 机 器 学 习 的 会 看 不 起 
做 多 媒体 的 ; 而 做 多 媒体 的 又 看 不 起 做 数据 库 的 。 纯 做 密码 学 研究 的 ， 鄙 
视 链 应 该 在 应 用 数学 与 机 器 学 习 方向 之 间 ， 哪 会 被 才 高 八 斗 的 黎 曼 看 上 ? 

能 看 上 黎 曼 的 自然 也 是 大 牛 ， 当 年 是 德国 数学 家 高 斯 看 中 了 他 并 很 欣 
赏 他 的 几何 学 观点 。 今 天 要 讲 的 也 不 是 黎 曼 猜想 ， 而 是 黎 曼 的 几何 学 观点 
与 人 工 智 能 的 关系 。 

当年 ， 黎 曼 申 请 来 到 哥 廷 根 大 学 做 无 薪 讲 师 ， 就 是 学 校 不 提供 固定 薪 
水 ， 讲 了 课 才 有 薪水 的 教师 。 初 来 乍 到 ,来 场 学 术 报告 是 必需 的 。 当 时 的 
学 术 委员 会 从 黎 曼 推荐 的 3 个 选 题 中 选 了 1 个 他 最 意外 的 题目 , 要 他 以 “ 关 
于 几何 学 的 基本 假设 ”为 主题 来 作 就 职 报告 。 

那个 时 候 ， 公 元 前 3 世纪 和 希腊 亚历山大 里 亚 学 派 的 创始 者 欧 几 里 得 编 
写 的 数学 巨著 《几何 原本 》 中 的 5 条 公设 中 , 连 大 猩猩 都 很 痛恨 的 第 五 公 
设 ， 就 是 “平行 线 没有 香蕉 CHE 的 第 五 公设 ， 已 经 于 1830 年 被 罗 
伯 切 夫 斯 基 证 明 不 成 立 。 他 认为 在 一 个 平面 上 ， 过 已 知 直线 外 一 点 至 少 有 
两 条 直线 与 该 直线 不 相交 。 由 此 开创 了 非 欧 几 里 得 几何 ， 虽 然 他 的 理论 在 
其 去 世 后 12 年 才 逐 渐 被 认可 。 而 黎 曼 开创 的 非 欧 几何 则 断言 ， 在 平面 上 ， 
任何 两 条 直线 都 必然 相交 。 他 们 的 发 现 , 最 终 莫 定 了 非 欧 几何 的 数学 基础 。 
直观 来 说 ， 就 是 以 前 以 为 是 可 以 用 直线 测量 准确 距离 的 世界 ， 现 在 居然 要 
XE 

既然 变 了 ， 那 就 很 容易 相交 。 比 如 从 篮球 的 顶部 到 底部 ， 让 蚂蚁 沿 着 
表面 怜 ， 它 只 能 怜 出 曲线 ， 且 总 是 相交 的 。 在 这 个 篮球 曲面 上 测 得 的 距离 
就 只 能 是 曲线 的 长 度 ， 这 条 曲线 称 为 测 地 线 (geodesic )。 

在 黎 曼 用 了 7 周 时间 准 备 的 报告 中 ， 他 希望 在 能 用 直线 测 距离 的 欧 氏 
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空间 和 不 能 用 直线 测 的 非 欧 空间 之 间 找 到 合理 的 衔接 。 于 是 ， 他 假定 非 欧 
空间 可 以 由 好 几 个 局 部 欧 氏 空间 拼接 而 成 的 ， 提 出 了 多 个 ( 英文 的 前 缀 是 
mani ) 折 或 层 (英文 的 词根 是 fold) 的 概念 ， 即 流 形 (manifold， 对 应 的 德 
语 是 mannigfaltigkeit )。 简 单 且 不 严格 来 说 ， 就 是 流 形 可 以 用 一 块 块 的 小 条 
土 以 任意 形式 粘 在 一 起 来 表征 ， 
但 每 块 局 部 的 黏土 又 跟 我 们 党 
见 的 欧 氏 空间 是 一 致 的 ， 如 
图 7.1 Stas. FAAS dl EIR 
之 间 的 连接 关系 ， 则 要 把 连续 
性 、 光 滑 性 、 可 微 性 、 抽 象 性 
x, 等 众多 深奥 概念 考虑 进来 ， 这 


样 便 成 了 多 数 人 只 能 看 懂 目 录 
图 7.1 局 部 欧 氏 与 黎 曼 流 形 : 二 维 流 形 或 曲 
Li guy V os F 
面 M 上 的 一 个 局 部 C, (HERA) 的 微分 流 形 。 
与 欧 氏 空间 中 的 黄色 区 域 等 价 后 来 ， 爱 因 斯 坦 知道 后 ， 


如 获 至 宝 。 便 找 了 当年 他 提出 
狭义 相对 论 时 涉及 的 “ 洛 伦 效 变换 ”的 提出 者 、 数 学 家 洛 伦 效 本 人 ， 请 他 
帮助 学 习 微 分 流 形 基础 。 在 洛 伦比 的 帮助 下 ， 最 终 爱 因 斯 坦 基于 加 速度 下 
的 不 变性 原理 提出 了 广义 相对 论 ， 将 牛顿 提出 的 万 有 引力 归结 为 弯曲 空间 
的 外 在 表现 ， 开 启 宇 观 领 域 的 物理 学 研究 。 
不 过 ， 那 个 时 候 ， 计 算 机 还 没 诞 生 ， 也 没 人 会 意识 到 黎 曼 提出 的 流 形 
与 人 工 智能 有 什么 关系 。 
感知 的 流 形 方 式 
回 到 人 的 智力 发 育 上 讨论 这 一 关系 的 存在 性 。 儿 童 在 发 育 过 程 中 ， 空 
间 感 是 逐渐 形成 的 。 在 他 学 习 观 察 世 界 的 过 程 中 ， 一 个 需要 扫除 的 认 知 障 
碍 是 谈 挡 。 有 心理 学 家 做 过 实验 ， 在 小 孩 面前 放 一 个 屏障 ,然后 将 小 孩 面 


万 CI 的 坐标 


二 维 空间 R? 


42 


前 的 玩具 移 到 屏障 后 ， 小 孩 会 感觉 很 吃惊 ， 却 不 会 绕 到 屏障 后 去 寻找 玩具 。 
这 说 明 在 发 育 的 初始 阶段 ， 小 孩 缺乏 对 三 维 空间 尤其 是 空间 深度 的 理解 。 
要 经 过 一 段 时 间 后 ， 他 的 这 种 空间 障碍 才 会 消除 ， 对 物体 空间 能 力 的 辨识 
也 明显 加 强 。 


过 了 这 个 阶段 后 ， 就 可 以 给 小 朋友 ego, (IOS 


看 一 张 有 趣 的 测试 图 ， 如 图 72 所 示 。 £20) ZE 
= 
放 一 个 奇形怪状 的 积木 ， 然 后 给 几 个 不 Il 


同 旋 转角 度 的 形状 ， 其 中 一 个 或 多 个 是 @ 四 


该 积木 施 续 后 的 真实 图 像 ， 也 有 不 是 的 ， $e 
让 小 朋友 自己 去 判断 和 识别 哪些 是 原来 Paes E $ 
的 积木 旋转 过 来 的 。 令 人 惊奇 地 是 ， 小 aoe 
慢 慢 都 会 学 会 如 何 处 理 这 种 旋转 ， wy A 

并 能 准确 判断 。 这 种 旋转 不 变性 能 力 的 
获得 ， 在 格式 塔 心理 学 中 有 过 相应 的 观 
察 和 描述 。 该 现象 似乎 在 告诉 我 们 ， 人 的 大 脑 能 对 每 一 个 见 到 的 物品 进行 
自动 的 旋转 。 

那么 ， 人 是 如 何 记忆 这 些 见 过 的 物品 ， 并 实现 自动 旋转 的 呢 ? 格式 塔 
心理 学 中 没有 给 出 终极 答案 。 

而 认 知 心理 学 则 对 记忆 给 了 一 种 可 能 解释 ， 叫 原型 说 (prototype )， 即 
某 个 概念 都 会 以 原型 的 形式 存储 在 记忆 中 ， 神 经 心理 学 进一步 给 了 假设 性 
的 支持 ， 称 记忆 是 存储 在 离散 吸引 子 (discrete attractor) 上 。 尽 管 这 一 解 
释 维持 了 相当 长 的 时 间 ， 但 并 没有 就 为 什么 大 脑 可 以 实现 自动 旋转 给 出 圆 
满 答案 。 

2000 年 , 宾 州 大 学 教授 塞 巴 斯 蒂 安 . 商 (Sebastian Seung ) 和 丹尼尔 : 李 
( Daniel Lee ) 在 Science 《科学 》) 上 发 表 了 一 篇 论文 中 。 他 们 认为 人 是 以 
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流 形 方式 来 记忆 的 。 以 视觉 


感光 细胞 
(=: 感知 为 例 ， 假 定 人 的 视 网 
- Mou ; 眼 


膜 只 有 3 个 视神经 元 ,不 

考虑 颜色 的 变化 ， 每 个 神 

经 元 能 感受 一 定 的 光 强 变 

入 一 化 ， 那 么 看 到 一 位 母亲 的 

ES 人 脸 后， 视神经 元 上 会 有 3 

x B [3 r3 个 响应 。 如 果 3 个 视神经 

图 73 母亲 和 小 孩 的 流 形 感知 方式 ， 假 定 眼 睛 ”元 是 相互 独立 的 ， 那 就 可 

只 有 3 个 视神经 元 ， 母 亲 小 孩 均 只 有 一 ”以 把 每 一 个 视神经 元 看 成 

个 自由 度 ， 即 左右 转 头 中 IUS era re 

个 维度 张 成 的 欧 氏 空 间 。 如 果 把 只 是 做 了 侧 向 角度 变化 的 、 母 亲 的 照片 读 
入 这 个 空间 , 那 3 张 图 所 示 的 图 像 在 此 空间 会 有 何 规律 呢 (图 7.3 ) ? 

理论 上 讲 ， 如 果 只 做 了 侧 向 角度 变化 ， 那 这 个 变化 就 是 3 张 图 像 的 内 

在 控制 量 。 只 有 一 个 变量 ， 但 又 不 见得 会 是 直线 ， 所 以 ， 母 亲 的 照片 按 角 

度 的 顺序 连 起 来 ， 就 会 是 一 条 曲线 。 类 似 的 ， 如 果 把 小 朋友 侧 向 角度 变化 

的 照片 也 输 进 来 ， 那 同样 在 这 个 三 维 空间 会 是 一 条 曲线 。 但 可 能 与 母亲 的 

不 在 同一 条 曲线 上 。 如 果 这 个 假设 成 立 ， 那 么 记忆 就 可 能 是 沿 着 这 两 条 不 

同 的 曲线 来 分 别 还 原 和 生成 不 同 角度 的 母亲 和 小 孩 图 像 。 这 也 就 能 部 分 解 
释 ， 为 什么 人 只 用 看 陌生 人 一 两 眼 ， 就 能 认 出 其 在 不 同 角度 时 的 面容 。 

如 果 再 进一步 ， 假 设 母亲 小 孩 有 两 个 自由 度 的 变化 ， 如 左右 、 上 下 角 

度 的 变化 ， 那 这 两 个 维度 的 变化 在 三 维 空间 上 可 以 张 成 无 数 条 曲线 的 合集 ， 

即 曲面 。 在 流 形 的 术语 中 ， 曲 线 可 以 称 为 一 维 流 形 ， 而 曲面 则 为 二 维 流 形 。 

如 果 假 定 变化 再 丰富 点 ， 比 如 角度 的 变化 有 上 下 角度 、 左 右 角度 ; 还 

有 表情 的 变化 、 真 实 和 细微 的 微 表 情 、 光 照 的 变化 、 年 龄 的 变化 等 诸如 此 
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类 的 ,我 们 把 这 些 变 化 的 维度 称 为 人 脸 变 化 的 内 在 维度 ， 是 真正 需要 记忆 
的 。 相 比较 于 人 眼 里 上 亿 的 视神经 元 总 数 来 说 ， 这 些 内 在 维度 可 以 张 成 的 
空间 比 上 亿 维 神经 元 张 成 的 空间 要 小 很 多 。 我 们 便 可 以 在 曲面 的 名 字 上 再 
加 个 “ 超 ” 字 来 刻画 ， 叫 超 曲面 ， 也 称 为 低 维 流 形 。 考 虑 到 输入 进来 的 信 
息 是 通过 神经 元 的 ， 所 以 ， 又 称 其 为 能 套 在 高 维 空间 ( 视神经 元 空间 ) 的 
低 维 流 形 。 

与 经 典 的 原型 学 说 的 主要 不 同 在 于 ， 假 设 用 于 记忆 的 离散 吸引 子 能 
替换 成 连续 吸引 子 ( 图 7.4 )， 于 是 存储 在 大 脑 里 的 原型 便 不 再 是 一 个 点 ， 
而 可 能 是 一 条 曲线 、 一 个 曲面 甚至 超 曲面 。 视 觉 看 到 的 任何 内 容 ， 都 会 从 
不 同 途 径 收敛 到 这 个 连续 吸引 子 上 ， 并 在 此 吸引 子 上 实现 对 不 同 角度 和 不 
同 内 在 维度 的 外 推 。 这 在 某 种 意义 上 既 解释 记忆 的 方式 ， 又 能 部 分 解释 自 
动 旋转 问题 。 因 此 , 黎 曼 流 形 的 构造 有 可 能 解决 格式 塔 心理 学 中 提 及 的 “ 旋 
转 不 变性 ”问题 。 


AFR 


图 7.4 离散 吸引 子 (a) 与 连续 吸引 子 (b) P9 


那 能 否 让 计算 机 也 实现 类 似 的 自我 旋转 或 推理 能 力 呢 ?如 果 能 实现 ， 
也 许 就 往 人 工 智 能 方向 迈进 了 一 小 步 。 

流 形 学 习 的 研究 

以 人 脸 为 例 ， 先 看 最 初 的 人 脸 识别 技术 。 早 期 的 做 法 是 遵循 欧 氏 空间 
距离 ， 按 最 短 直 线 距 离 来 评判 。 这 样 做 的 不 足 是 没有 处 理 好 不 同 角度 、 不 
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同 光照 的 人 脸 识 别 。 试 想 想 ， 如 图 7.5 所 示 的 两 个 木偶 ， 左 边 图 和 中 间 的 
木偶 是 两 个 不 同 角 度 的 同一 木偶 ， 中 间 和 右边 的 木偶 是 均 为 正面 的 两 个 不 
同 木偶 。 假 如 识别 是 基于 相同 像素 位 置 的 光 强 差 异 平方 总 和 的 最 小 值 来 实 

， 那 么 哪 两 张 会 更 近 呢 ?7 显然 相同 角度 的 中 间 木 偶 与 右边 木偶 距离 会 
近 。 这 就 是 欧 氏 距离 直接 用 于 人 脸 识别 和 目标 识别 的 不 足 。 


图 7.5 两 个 木偶 的 人 脸 在 不 同 角度 下 的 示意 图 


为 什么 计算 机 没有 人 脑 的 旋转 不 变性 呢 ? 图 7.6 显示 了 一 组 人 脸 在 摄像 
机 前 仅 进 行 平移 而 保持 其 他 性 质 不 变 的 图 像 集中。 如 果 把 每 个 像素 视 为 一 
个 维度 ， 则 每 张 照 片 可 视 为 高 维 空间 的 点 ， 而 多 次 采集 的 多 个 人 的 照片 集 
合 就 是 该 空间 的 点 云 。 通 过 某 些 简单 的 统计 策略 总 结 出 前 3 个 主要 的 维 数 ， 
再 将 点 云 投影 到 这 个 三 维 空间 并 两 两 描绘 出 来 ， d 

不 难 发 现 ， 只 控制 了 角度 旋转 的 图 像 序列 变 成 了 一 条 又 一 条 的 曲线 ， 
这 正 是 我 们 上 面 讨论 的 曲线 ， 即 一 维 流 形 。 实 际 上 ， 如 果 限 定 采集 时 的 变 
量 为 人 脸 到 摄像 机 前 的 远近 变化 ,结果 也 是 一 样 。 这 一 实验 部 分 印证 了 人 
脸 图 像 的 内 在 控制 变量 是 低 的 ， 有 物理 意义 的 。 因 此 ， 如 果 和 希望 计算 机 能 
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对 不 同 角度 的 人 脸 有 合理 的 推测 功能 ， 并 还 原 格 式 塔 心理 学 中 的 旋转 不 变 
性 时 ， 找 到 流 形 结构 并 依照 它 的 规则 来 办 事 就 很 自然 了 。 


toss 


BEES. 


图 7.6 人 脸 内 在 维度 示例 Ol 


但 是 ， 数 据 形成 的 流 形 结构 并 非 只 有 曲线 一 种 情况 ， 它 可 能 会 有 如 
图 7.7 所 示 的 瑞士 卷 的 复杂 结构 。 它 可 能 还 不 止 一 个 ， 比 如 两 个 卷 在 一 起 
的 双 螺 旋 线 。 那 么 ， 要 想 利用 经 典 又 好 用 的 欧 氏 距离 来 解决 问题 ， 可 行 的 
方案 之 一 就 是 把 它们 摊 平 或 拉平 这样， 我 们 待 分 析 的 数据 所 处 的 空间 就 
是 欧 氏 空间 了 。 于 是 ， 有 大 量 的 流 形 学 习 的 工作 便 在 此 基础 上 展开 了 。 


(a) (b) 
图 7.7 各 种 复杂 的 流 形 结构 
(a) 瑞士 卷 (Swissroll ) ; (b) 双 螺 旋 线 
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最 经 典 的 两 篇 文章 与 《 流 形 的 感知 方式 》 几 乎 同时 于 2000 年 发 表 在 
Science 《科学 》) 上 。 因 为 计算 机 科学 的 工作 很 少 有 在 Science 上 发 表 的 ， 
能 发 表 在 上 面 ， 则 有 可 能 引导 大 方向 的 研究 。 所 以 ， 这 三 项 工作 被 视 为 引 
领 了 2000 年 后 流 形 学 习 发 展 的 奠基 之 作 ”1 

其 想法 现在 来 看 的 话 ， 其 实 并 不 复杂 。 首 先 两 篇 文章 都 引入 了 邻 域 的 
概念 ， 也 就 是 局 部 情况 下 ， 流 形 等 同 于 欧 氏 空间 ， 因 此 ， 短 程 距离 用 欧 氏 


度量 来 计算 是 合理 的 。 
不 同 的 是 ， 特 南 鲍 姆 (Tenenbaum ) 的 工作 是 从 测 地 线 距 离 的 计算 来 
考虑 的 。 


试想 如 果 有 一 张 纸 , 纸 上 有 3 个 点 ,4、B 和 C,4B Ee AC 在 纸 面 上 更 近 。 
但 如 果 把 纸 弯 成 图 7.8 Ca) 的 形状 ,再 按 直线 距离 来 计算 时 ，AC 就 会 更 
近 。 但 按 流 形 的 定义 ，4C 这 条 路 径 是 不 能 出 现 的 ， 因 为 这 个 纸 就 是 一 个 
空间 ， 是 一 个 不 能 为 蚂蚁 逃脱 的 二 维 空间 。 因 此 ， 更 合理 的 计算 方式 是 把 
图 7.8 Ce) 的 蓝 色 曲线 长 度 ， 即 测 地 线 ( geodesic ) 精确 算出 来 。 


(c) 
图 7.8 测 地 线 距离 和 局 部 等 度 规 (Isomap ) 算法 P? 
但 测 地 线 是 在 连续 意义 上 定义 的 ， 要 根据 离散 的 数据 点 来 算 的 话 ， 特 
南 鲍 姆 等 找 了 个 平衡 ， 提 出 了 基于 图 距离 ( graph distance ) 的 局 部 等 度 规 
算法 。 他 们 假定 邻 域内 的 点 与 点 之 间 相 连 的 距离 都 等 于 1， 邻 域 以 外 的 距 
离 都 强 设 为 0。 因为 流 形 可 以 由 若干 个 小 的 邻 域 来 粘 合 构 成 ， 而 相 邻 的 邻 
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de up. WA, WRERAER N 1 的 都 连 条 边 出 来 ， 则 原 
来 的 数据 点 就 构成 了 一 张 连通 图 。 而 远 点 的 距离 或 者 所 谓 的 测 地 线 距 离 ， 
就 可 以 通过 连通 的 边 的 最 短 距离 来 近似 了 ， 如 图 7.8 Cb) 所 示 。 于 是 ， 就 
可 以 为 所 有 的 点 建立 一 个 相似 性 或 距离 矩阵 。 有 了 这 个 和 矩阵， 再 通过 统计 
方法 就 能 找到 其 主要 的 几 个 方向 了 ， 即 挫 平 的 低 维 子 空间 ， 如 图 7.8 (c) 
所 示 ， 蓝 色 的 测 地 线 距离 就 与 红色 的 图 距离 近似 相等 了 。 

而 罗 维 斯 (Roweis ) 和 洛 尔 (Laul) 当时 则 从 另 一 角度 来 尝试 恢复 这 
个 平坦 的 空间 。 他 假定 邻 域内 的 数据 点 会 相互 保持 一 种 几何 关系 ， 关 系 的 
紧密 程度 由 权重 来 决定 ， 权 重 的 总 和 等 于 1。 同 时， 他 假定 这 个 权重 诱导 
的 关系 在 平坦 空间 会 与 观测 的 空间 保持 一 致 ， 即 局 部 结构 不 变 。 当 然 ， 还 
得 防止 数据 在 还 原 到 低 维 的 平坦 空间 时 不 至 于 夫 缩 至 一 点 去 。 基 于 这 些 假 
设 ， 很 自然 地 就 把 优化 方程 写 了 出 来 ， 并 获得 了 不 用 迭代 求解 的 直接 或 闭 
式 解 ， 即 局 部 线性 嵌入 算法 ， 如 图 7.9 所 示 。 

算法 比较 直 白 ， 但 

- "oo O 选择 邻 域 


两 篇 文章 都 发 现 了 类 似 于 o. 9 
图 7.3 和 图 7.4 的 现象 ， 即 
约 简 到 二 维 平面 后 ， 数 据 
的 分 布 具有 物理 意义 。 比 
如 ， 手 旋转 杯 的 动作 会 沿 
水 平方 向 连续 变化 ， 人 脸 
图 像 的 姿态 和 表情 会 在 两 
个 垂直 的 轴 上 分 别 连续 变 
化 。 而 这 种 情况 ， 以 前 的 
算法 似乎 是 找 不 到 的 。 除 
此 以 外 ， 这 两 篇 文章 的 成 图 7.9 局 部 线性 嵌入 (LLE) 算法 中 
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果 还 很 好 地 与 “感知 的 流 形 方式 ”吻合 了 。 

还 有 一 点 ， 邻 域 的 大 小 决定 了 流 形 的 表现 。 按 几何 学 大 牛 斯 皮 瓦 克 
(Spivak ) 的 说 法 ， 邻 域 如 果 和 整个 欧 氏 空间 一 样 大 ， 那 欧 氏 空间 本 身 就 是 
流 形 外。 所 以 ， 流 形 学 习 的 研究 并 非 是 一 个 很 特殊 、 很 小 众 的 方向 ， 它 是 
对 常规 欧 氏 空间 下 研究 问题 的 一 般 性 推广 。 

于 是 ， 从 2000 年 开始 ， 国 内 外 对 流 形 学 习 的 研究 进入 了 高 潮 , 希望 能 
找到 更 有 效 的 发 现 低 维 平 坦 空 间 的 方法 。 比 如 希望 保持 在 投影 到 平坦 空间 


保持 的 海 木 方法 、 希 望 保持 曲面 长 宽 比 不 变 的 最 大 方差 展开 方法 、 希 望 保 
持 局 部 权重 比 不 变 的 拉 普 拉 斯 算法 等 。 不 管 何 种 方法 ， 都 在 尝试 还 原 或 保 
持 流 形 的 某 一 种 性 质 。 也 有 考 
虑 数据 本 身 有 噪声 导致 结构 易 
被 误导 的 ， 比 如 我 们 经 常 在 星 
际 旅 行 中 提 到 的 虫 洞 现象 ， 如 
图 7.10。 它 可 以 将 原本 隔 得 很 
远 的 两 个 位 置 瞬 间 拉 近 。 在 数 
据 分 析 中 ， 称 虫 洞 为 捷径 或 短 
路 边 (shortcut )， 它 是 需要 避免 
图 7.10 当 数据 存在 噪声 时 ， 容 易 将 图 7.8 ”的 ， 不然 会 导致 还 原 的 空间 是 
中 的 4 和 C 连 接 而 形成 类 似 于 科幻 不 正常 其 至 错误 的 


小 说 中 星际 穿越 用 的 时 洞 ， 或 流 形 
学 习 中 的 短路 边 (shortcut) 问题 除了 找 空间 外 ， 流 形 的 一 


些 性 质 也 被 自然 地 作为 约束 条 
件 加 入 到 各 种 人 工 智 能 或 机 器 学 习 的 优化 算法 里 。 即 使 是 现在 盛行 的 深度 
学 习 研 究 中 ， 流 形 的 概念 也 被 很 时 黎 地 引入 进来 。 如 生成 对 抗 网 在 2014 年 
最 初 提出 的 时 候 ， 杨 立 昆 (Yann LeCun ) 就 指出 希望 对 抗 的 数据 处 在 数据 


50 


复杂 视觉 错觉 。 


流 形 中 能 量 相对 高 的 位 置 ， 而 真实 数据 则 位 于 流 形 能 量 相对 低 的 位 置 ， 这 
样 就 有 可 能 让 生成 对 抗 网 获得 更 好 的 判别 能 力 叶 (图 7.11 )。 

不 太 可 能 的 未 来 

(高 能 量 ) 


可 能 的 未 来 


(低能 量 ) 


图 7.11 生成 对 抗 网 中 的 流 形 与 能 量 ， 假 设 此 曲面 位 于 三 维 坐标 系 里 多 


流 形 学 习 的 思考 

虽然 流 形 学 习 在 认 知 、 机 器 学 习 方面 都 有 很 好 的 可 解释 性 ， 不 过 这 几 
年 随 着 深度 学 习 的 盛行 ， 与 它 相关 的 文献 在 相对 分 量 上 减少 了 许多 。 一 个 
原因 是 ， 由 于 这 一 波 人 工 智能 的 热潮 主要 是 从 产业 界 开始 的 ， 而 产业 界 对 
预测 的 重视 程度 远 高 于 可 解释 性 。 所 以 ， 不 管 学 术 界 还 是 产业 界 都 把 重心 
放 到 如 何 优 化 深度 学 习 模 型 的 结构 和 参数 去 了 。 然 而 正如 我 在 附录 文章 中 
强调 的 ， 过 分 关心 预测 性 能 的 同时 ， 必 然 会 牺牲 可 解释 性 。 因 为 前 者 关心 
个 例 ， 后 者 需要 统计 。 两 者 是 一 个 矛盾 体 ， 类 似 于 测 不 准 定理 中 的 速度 和 
位 置 的 关系 。 从 目前 的 情况 来 看 ， 牺 牲 的 可 能 还 不 止 流 形 学 习 这 一 种 具有 
可 解释 性 的 方法 。 尽 管 大 家 在 讨论 数据 的 时 候 ， 还 会 时 不 时 说 起 流 形 ， 但 
最 多 也 只 是 扔 个 概念 出 来 ， 并 没有 太 多 实质 性 的 融入 。 

再 回 到 人 的 大 脑 来 看 ， 虽 然 之 前 也 提 到 了 流 形 的 感知 方式 ， 但 是 否 


T 爱 犯错 的 智能 体 


存在 实证 还 不 是 完全 明确 ，Seung 和 Lee 也 只 是 做 了 些 间 接 的 推测 。 一 方 
面 ， 是 测量 技术 的 不 足 。 因 为 现在 都 是 采用 脑 电波 electroencephalogram , 
EEG ) 或 功能 性 磁 共 振 成 像 ( functional magnetic resonance imagine, fMRI ) 
技术 来 检测 大 脑 信 号 的 ， 本 身 就 缺乏 这 种 连续 性 的 关联 ， 要 寻找 大 脑 中 是 
和 否 存在 流 形 记忆 确实 有 难度 。 另 一 方面 ， 我 们 的 大 脑 里 面 真有 一 个 弯曲 的 
流 形 记 忆 空 间 吗 ?” 真是 以 连续 而 非 离散 吸引 子 形式 存在 吗 ? 如果 是 的 ， 那 
与 现在 深度 学 习 的 预测 模型 的 做 法 应 该 是 不 同 的 ， 其 差别 就 如 同 飞机 和 鸟 。 
也 许 ， 找 寻 这 个 问题 的 答案 ， 和 黎 曼 猜想 的 破解 一 样 困难 。 
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三 (@) 由 粗 到 细 、 大 范围 优先 的 视觉 


第 一 次 睁 眼 的 时 候 ， 我 还 在 娘 胎 ， 仿 佛 看 到 了 一 片 红色 ， 

然后 我 又 继续 睡 了 ; 第 二 次 睁 眼 时 ， 已 是 出 院 的 时 候 ， 我 被 母 

亲 抱 着 坐 在 三 轮 车 上 ， 我 看 到 一 位 白 大 袖 医 生 站 在 一 个 拱 形 

的 门 前 向 我 们 招手 。 

人 的 记忆 是 非常 奇妙 的 。 有 时 候 记 忆 可 能 是 先 存储 ， 再 被 自己 重新 分 
析 的 ; 也 可 能 完全 是 错乱 不 可 靠 的 ， 但 通过 不 断 的 心理 暗示 加 强 后 ， 结 
自己 都 信 了 ， 如 同 引 文中 描述 的 一 样 。 未 出 生 的 胎儿 怎么 会 看 到 颜色 ， 又 
怎么 知道 颜色 是 哪 种 呢 ? 

不 过 新 生 儿 在 初始 所 能 看 见 的 ， 只 是 一 片 完全 模糊 不 清 的 世界 。 原 因 
有 了 两 个 ， 一 是 眼睛 的 发 育 虽 然 已 经 基本 完成 ， 但 眼球 前 后 径 仍 较 短 ， 晶 状 
体 的 调节 功能 还 没 达 到 最 优 ， 视 力 只 有 成 人 的 1/30, 视角 只 有 45”。 二 是 
大 脑 在 此 时 还 处 在 一 个 类 似 刚 买 回来 的 计算 机 主机 状态 ， 除 了 安装 了 后 面 
会 定期 自动 升级 但 几乎 不 会 蓝屏 的 神奇 操作 系统 外 ， 应 用 程序 还 很 少 ， 硬 
盘 也 几乎 是 空 的 。 因 此 ， 大 脑 还 无 法 及 时 和 准确 处 理 从 视觉 神经 元 输送 过 
来 的 信息 ， 也 无 法 从 模糊 的 视觉 信息 中 生成 更 清晰 的 “图 像 ”。 一 切 皆 在 学 
习 的 初级 阶段 。 另 外 ， 人 类 的 新 生 儿 刚 出 生 时 是 没有 行动 能 力 的 。 比 如 新 
生 儿 脖子 的 力量 连 头 都 撑 不 起 ， 更 不 用 说 转动 了 。 新 生 儿 的 四 肢 也 根本 不 
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能 支持 其 独立 行动 。 这 些 都 使 得 新 生 儿 在 刚 出 生 时 ， 只 能 看 到 、 听 到 、 学 
习 到 有 限 的 信息 。 

发 育 到 1 个 月 左右 时 ， 听 觉 基 本 就 发 育成 熟 了 ， 但 视力 仍然 处 在 近视 
阶段 。 新 生 儿 能 看 清 物 体 的 距离 最 多 15~30cm， 而 能 集中 注意 力 观察 的 时 
间 不 超过 5 秒 。3~4 个 月 后 ， 能 看 清 的 距离 增加 到 75cm， 平 均 视力 仍 仪 为 
0.1。 新 生 儿 也 能 控制 自己 的 头 的 转动 了 ， 所 以 ,能 接收 并 可 学 习 的 信息 量 
涨 了 不 少 。 据 统计 ， 一 般 到 6~8 个 月 后 ， 新 生 儿 的 视力 才 会 和 成 人 一 样 ， 
能 基本 看 清楚 周围 世界 。 但 看 到 的 内 容 ， 从 现 有 的 文献 可 知 ， 只 是 一 些 外 
在 轮廓 的 印象 。 正常 情况 下 , 儿童 的 视力 在 5 周岁 时 发 育 完全 , 视力 达到 1.0 
或 以 上 。 

从 进化 角度 来 看 ， 如 果 新 生 儿 是 独立 在 野外 成 长 ， 这 么 缓慢 的 视力 发 
育 似乎 不 符合 优胜 劣 汰 原则 。 作 为 对 比 ， 小 鹿 生 下 来 几 小 时 内 就 得 睁 开眼 
睛 、 学 会 走路 。 所 幸 地 是 ， 与 小 鹿 不 同 ， 人 类 新 生 儿 的 父母 庇护 能 力 要 强 
大 得 多 ， 所 以 新 生 儿 不 会 立刻 走路 、 眼 睛 一 片 胖 胱 也 没关系 。 那 么 ， 这 种 
视觉 发 育 对 人 的 智能 有 何 益处 呢 ? 

当 新 生 儿 最 初 的 视力 非常 弱 时 ， 多 数 情况 下 能 看 到 的 只 有 物体 的 整 
体 结构 ， 对 细节 的 抓 取 和 记忆 能 力 并 不 具备 。 人 工 智能 先驱 马 文 * 明 斯 
基 在 他 的 书 《 情感 机 》 中 举 过 一 个 例子 ， 弗 朗 西 斯 卡 * 阿 塞 拉 ( Francesca 
Acerra ) 等 在 1999 年 的 文章 中 曾 报道 过 :“4 天 大 的 新 生 儿 看 父母 的 脸 的 时 
间 要 长 于 陌生 人 ， 但 如 果 母 亲 用 头巾 把 头发 的 轮廓 或 头 的 外 部 轮廓 遮盖 后 ， 
则 时 间 差 异 的 现象 就 没有 了 ”2 。 这 间接 说 明了 新 生 儿 是 以 整体 结构 视 
觉 为 基础 的 。 

另外 ， 大 脑 的 视觉 中 枢 系 统 在 建构 的 过 程 中 ， 对 相同 目标 的 反复 学 习 
和 再 认识 ， 应 该 多 会 以 最 初 模糊 知觉 形成 的 认 知 原型 为 基础 来 提升 ， 而 不 
应 建立 在 对 先前 经 验 的 全 盘 和 否定 上 。 随 着 视力 的 提高 和 大 脑 发 育 的 继续 完 
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善 ,大 脑 会 逐渐 丰富 各 个 认 知 原型 的 细节 ， 从 而 获得 对 目标 粒度 更 丰富 的 
认识 ， 直 至 稳定 。 这 一 视觉 发 育 或 多 或 少 与 认 知 心理 学 中 常 被 提 及 的 大 范 
围 优先 理论 相关 ， 也 与 计算 机 视觉 中 常常 用 到 的 由 粗 到 细 ( coarse-to-fine ) 
框架 很 相似 。 

异曲同工 : 由 粗 到 细 与 大 范围 优先 

与 近代 知觉 研究 中 占 统治 地 位 、 强 调 视 知觉 过 程 是 从 局 部 到 整体 的 初期 
特征 分 析 的 理论 不 同 ,“ 大 范围 优先 ”假设 强调 全 局 特征 的 认 知 要 优 于 局 部 
特征 ， 最 早 是 纳 冯 (Navon) F 1977 年 提出 来 的 9 1。 直观 来 说 ， 就 是 “ 先 
看 到 和 森林， 再 看 到 树 "”。 其 观点 通过 一 组 认 知 实验 进行 了 验证 。 粗 略 来 讲 ， 
他 将 若干 小 的 字母 拼 成 一 个 大 的 字母 ， 大 小 字母 可 以 相同 或 不 同 ， 如 图 8.1。 
通过 测试 者 对 大 小 字母 辨别 反应 时 间 
的 判断 ， 他 发 现在 多 数 情 况 下 ， 辩 识 
大 字母 的 反应 时 (response time ) 要 短 
于 小 字母 。 尽 管 在 实验 细节 上 ， 后 来 
的 研究 形成 了 诸多 的 变化 和 新 的 发 现 ， “大 范围 
但 并 没有 完全 推翻 Navon 强调 的 “ 整 
体 优 先 ” 观 点 。 而 对 此 现象 的 解释 ， 
众说 纷 颖 。 如 有 借鉴 格式 塔 心理 学 的 
对 称 性 、 平 行 性 、 封 闭 性 来 解释 整体 
认 知 性 质 的 ， 而 中 科 院 院士 、 著 名 认 
知 科学 家 陈 霖 也 提出 了 “大 范围 优先 ” 
的 拓扑 性 质 初期 知觉 理论 外。 但 因为 某 些 情况 下 小 范围 也 具有 这 种 性 质 ， 目 
前 似乎 还 没有 令 大 家 都 满意 的 答案 。 

不 过 ， 如 果 从 视觉 发 育 的 角度 来 看 ， 这 种 大 范围 优先 的 策略 也 许多 少 
与 人 类 的 视觉 发 育 机 制 有 些 关系 。 因 为 最 初 的 弱视 ， 人 类 只 能 看 清楚 目标 


局 部 


图 8.1 Navon 关 于 大 范围 优先 假设 
使 用 的 复合 刺激 图 形 PT 
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“， 爱 犯错 的 智能 体 


的 大 致 结构 或 轮廓 ， 因 此 必须 要 根据 这 些 结构 或 轮廓 来 形成 对 目标 的 辨识 。 
试想 当 人 类 看 到 捕食 者 如 豹子 的 时 候 ， 只 根据 轮廓 这 一 整体 特征 就 能 快速 
辨识 豹子 ， 显 然 更 便于 人 类 避免 危险 。 如 果 等 他 仔细 把 豹子 的 各 项 局 部 特 
征 如 纹理 、 脸 部 特征 、 毛 发 长 短 等 分 析 完 毕 ， 再 判定 是 否 为 豹子 和 决定 要 
逃跑 时 ， 可 能 已 悔 之 晚 侨 。 另 外 ， 如 果 初 始 视力 就 是 非常 完善 的 ， 那 么 刚 
混沌 初 开 的 大 脑 可 能 会 因 接受 的 信息 太 多 ， 无 法 处 理 ， 导 致 宕 机 ; 而 且 只 
看 轮廓 ， 大 脑 分 析 消 耗 的 计算 资源 和 能 量 都 小 ， 因 此 形成 辨识 的 时 间 会 短 ， 
更 有 利于 生存 和 学 习 。 因 此 ， 大 范围 优先 的 策略 能 帮助 形成 对 目标 的 快速 
判断 ， 而 不 需要 大 脑 进行 不 必要 的 、 深 层次 的 分 析 。 

无 独 有 偶 ， 计 算 机 视觉 或 人 工 智能 领域 也 有 着 异曲同工 之 妙 的 策略 。 

首先 是 由 粗 到 细 的 策略 。 这 一 策略 最 早 见 于 20 世纪 90 年 代 初 期 的 
人 脸 检 测算 法 中 。 那 时 ，CPU? 刚刚 到 486 的 水 平 ， 想 玩 游戏 都 得 拿 个 容 
^t 1.2MB 的 8 十 软盘 去 复制 ， 与 现在 算 力 和 容量 都 很 强大 的 计算 机 相 比 
简直 就 弱 极 了 。 如 果 人 脸 图 像 分 辩 率 稍微 高 点 ， 就 很 难 做 到 高 效 检测 。 要 
解决 这 一 问题 ，1994 年 美国 伊利 诺 伊 大 学 厄 巴 纳 - 香槟 分 校 的 杨 ( Yang) 
和 黄 (Huang) 提出 了 由 粗 到 细 的 方案 5， 如 图 8.2 所 示 。 具 体 来 说 ， 就 
是 先 把 人 脸 图 像 大 小 缩小 至 1/64 (长 宽 各 1/8， 常 称 为 8 倍 降 采 样 )。 缩 
小 后 的 图 像 直接 放大 回 原 图 大 小 的 效果 就 是 马赛 克 了 。 虽 然 是 马赛 克 的 图 
像 ， 也 看 不 清楚 内 容 是 什么 , 但 从 图 像 像 素 光 强 的 分 布 来 看 ， 可 以 考虑 规 
则 “人 脸 的 中 心 部 位 有 4 个 格子 (cell) 具有 基本 一 致 的 强度 ”。 这 一 规 
则 可 以 用 于 初 得 潜在 的 人 脸 区 域 。 再 根据 人 脸 上 眼睛 和 嘴巴 的 固有 关系 ， 
继续 做 进一步 的 筛 查 。 完 成 候选 区 域 得 查 后 ， 再 回 到 原始 大 小 的 图 像 上 ， 
从 选 好 的 候选 区 域 中 根据 原始 像素 来 查找 真正 的 人 脸 。 巾 于 降 采 样 这 一 步 
将 人 脸 缩 小 到 了 1/64， 且 规则 的 搜索 不 需要 执行 复杂 的 浮 点 计算 ， 于 是 ， 


(D CPU: central processing unit, 中 央 处 理 器 。 
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复杂 视觉 错觉 


这 一 由 粗 到 细 的 人 脸 检测 算法 ,在 当时 算 力 很 弱 的 环境 下 ， 也 能 非常 高 效 
地 完成 人 脸 检 测 任务 。 如 果 不 考 虑 人 类 视力 发 育 需要 的 时 间 ， 由 粗 到 细 和 
人 的 视觉 感知 中 的 整体 到 局 部 的 策略 是 类 似 的 ， 也 可 以 看 成 是 一 种 结构 或 
大 范围 优先 的 策略 。 


图 8.2 ”由 粗 到 细 的 人 脸 检测 算法 
(a) 子 采 样 效果 ; (b) 人 脸 灰 度 规则 [9 


其 次 相关 的 是 金字 塔 策略 ( 图 8.3 )。 据 说 ， 人 金字塔 在 能 量 收集 上 有 着 
神奇 的 效果 。 所 以 ,计算 机 视觉 和 图 像 处 理 领域 的 科学 家 们 也 喜欢 在 处 理 
计算 机 视觉 任务 时 ， 用 它 来 收集 比 单 幅 图 像 更 多 的 能 量 信息 。 比 如 ， 在 做 
图 像 压缩 时 ， 大 家 喜欢 把 图 像 缩 小 一 半 ， 然 后 再 用 原 图 减 去 缩小 后 插值 放 
大 的 图 ， 得 到 图 像 的 残 差 信息 。 再 把 缩小 的 图 继续 缩小 一 半 ， 然 后 与 之 前 
缩小 的 图 相 减 ， 得 到 缩小 图 像 的 残 差 信息 。 和 迭代 下 去 后 ， 可 以 得 到 一 组 持 
续 缩 小 的 残 差 图 像 。 因 为 每 次 图 像 都 缩小 一 半 ， 笃 起 来 看 的 话 ， 就 像 是 一 
个 金字 塔 。 由 于 残 差 的 像素 灰 度 或 强度 值 往往 比较 集中 ， 所 以 就 比较 容 
易 找到 短 的 编码 来 刻画 这 些 频繁 出 现 的 值 ， 因 而 能 帮助 提高 压缩 编码 的 
效率 中。 还 有 将 金字 塔 策略 用 于 高 阶 特征 抽取 的 ， 如 深度 学 习 之 前 流行 的 
尺度 不 变 特征 变换 ( scale-invariance feature transform, SIFT ) 算 子 外 和 随 
后 改进 了 速度 的 加 速 稳健 特征 ( speeded up robust features, SURF ) 算 子 四。 
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这 两 种 算 子 都 采用 不 同 尺 度 的 高 斯 (Gaussian ) 核 来 模糊 图 像 ， 以 提取 不 
同 尺度 的 特征 。SIFT 算 子 是 在 金字 塔 式 的 图 像 上 提取 特征 ， 而 SURF 算 子 
则 把 特征 提取 算 子 本 身 做 成 了 金字 塔 。 尽管 没有 涉及 大 范围 优先 的 思想 ， 
但 这 两 种 多 尺度 的 特征 提取 技术 或 多 或 少 体现 了 由 粗 到 细 的 思想 。 

即使 现在 人 工 智能 中 很 流行 的 生成 式 对 抗 深度 网 络 ， 也 有 研究 人 员 不 
免 俗套 地 将 图 像 金 字 塔 技术 嫁接 在 该 网 络 上 ， 提 出 了 金字 塔 生成 对 抗 网 ， 
以 便 能 生成 更 为 精细 的 图 像 91 

这 些 都 表明 了 由 粗 到 细 、 整 体 与 局 部 特征 相 结 合 、 大 范围 优先 的 策略 ， 
在 人 工 智能 的 多 数 相 关 应 用 中 是 有 实际 意义 的 。 
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由 细 到 粗 和 模糊 的 艺术 

模糊 到 清晰 是 一 种 由 粗 到 细 ， 体 现 了 大 范围 优先 的 思想 。 但 如 果 反 过 
来 ， 从 清晰 到 模糊 ， 有 时 候 会 带 来 一 些 奇 妙 的 错觉 。 人 视觉 的 模糊 程度 不 
仅 会 影响 认 知 ， 也 会 影响 人 对 图 像 内容 的 评判 ， 如 图 8.4 (a )。 这 张 图 中 有 
两 个 人 物 ， 爱 因 斯 坦 和 玛丽 莲 ' 梦 露 。 不 近视 的 人 能 看 到 爱 因 斯 坦 ， 近 视 
的 人 戴 眼 镜 看 到 的 是 爱 因 斯 坦 ， 取 下 眼镜 看 到 的 是 梦 露 。 而 图 8.4 (b) 是 
一 幅 满 是 马赛 克 的 照片 。 近 视 眼 的 同学 不 妨 把 眼镜 取 下 来 ， 仔 细 看 看 ， 是 
不 是 感觉 图 像 变 清 楚 了 ? 


图 8.4 LAMM Xs iE FE (a); 低 分 辨 率 的 合影 照 (b ) 


这 都 是 因为 取 下 眼镜 后 ， 人 的 大 脑 会 对 视觉 系统 输入 的 信息 进行 自动 
平滑 。 平滑 后 的 图 像 就 没有 原 马赛 克 图 像 那么 明显 的 边缘 ,结果 视觉 上 反 
而 会 觉得 更 清楚 了 。 也 许 这 种 “平滑 ”处 理 有 利于 人 类 在 行路 中 形成 快速 
判断 或 常识 智能 方面 的 判断 ， 而 不 必 拘 泥 于 路 面 的 细节 。 

这 种 平滑 不 仅 能 让 人 类 视觉 产生 “清晰 ”的 错觉 ， 有 的 时 候 它 还 能 帮 
助 提升 目标 识别 的 性 能 。 举 例 来 说 ， 根 据 行 人 走路 姿势 来 识别 行人 身份 的 
研究 。 我 们 曾经 发 现 ， 当 把 行人 步 态 轮廓 图 缩小 至 1/4 再 放大 时 ， 其 识别 
效果 反而 会 比 直接 识别 原 图 要 好 。 后 来 我 也 和 几 个 朋友 交流 过 ， 他 们 发 现 
在 人 脸 识别 中 也 存在 类 似 的 现象 中。 为 什么 把 图 像 缩小 再 放大 后 ,会 带 助 


爱 犯错 的 智能 体 


提升 性 能 呢 ? 我 们 给 出 的 一 种 解释 是 ， 原 始 步 态 或 人 脸 图 像 包含 的 噪声 相 
对 较 多 ， 缩 小 再 放大 需要 经 过 一 个 插值 平滑 过 程 。 有 可 能 这 个 平滑 过 程 帮 
助 去 除了 图 像 中 影响 判别 的 噪声 ， 因 此 导致 识别 性 能 提升 了 。 但 我 们 也 只 
是 猜想 ， 最 终 也 没有 谁 认 真 从 理论 上 去 分 析 过 真正 的 原因 。 

除 此 以 外 ， 模 糊 的 视觉 能 让 人 从 不 同 的 视角 去 看 世界 ， 它 对 艺术 也 是 
有 重要 贡献 。 据 说 法 国 印象 派 开创 先河 的 领袖 式 人 物 莫 奈 是 近视 眼 ， 于 是 
画 出 来 的 油画 都 比较 模糊 。 虽 然 
模糊 ， 却 有 不 同 的 效果 。 如 果 摘 
下 眼镜 看 他 们 的 画 ， 如 印象 派发 
展 史 上 有 领导 地 位 的 人 物 之 一 、 
法 国画 家 皮 埃 尔 - 奥 古 斯 特 ' 雷 
诺 阿 于 1876 年 创作 的 《前 饼 磨 坊 
的 舞会 》( 图 8.5 )， 就 能 从 平面 图 


像 中 感受 到 强烈 的 立体 感 。 所 以 ， 

xs 图 8.5 Sito (MBH) 
有 人 戏称 ， 印 象 派 是 专属 近视 眼 
的 独特 风景 。 


不 难看 出 ， 视 觉 的 发 育 是 个 有 趣 的 过 程 。 它 影响 了 人 的 视 知觉 系统 ， 
影响 了 人 在 不 断 认 识 、 学 习 和 记忆 事物 的 策略 ， 甚 至 于 大 脑 视觉 中 枢 对 原 
型 的 存储 方式 。 它 与 认 知心 理学 关心 的 大 范围 优先 性 可 能 也 存在 某 种 关联 。 
理解 视觉 的 发 育 ， 尤 其 是 由 粗 到 细 的 发 育 机 制 ， 也 许 就 能 更 好 地 理解 人 工 
智能 中 的 诸多 迹 之 机 制 ， 如 常识 智能 的 形成 。 
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=@ 抽象 的 颜色 与 高 层 认 知 


“这 双 鞋 有 色差 ， 左 边 的 比 右边 的 深 一 点 ， 你 难道 没 发 现 
吗 ”? 我 仔细 看 了 半天 ， 惕 是 没 看 出 差别 ! 不 过 ， 我 还 是 陪 
着 她 就 鞋子 的 色差 一 起 去 店 老板 那儿 理论 了 一 番 ， 虽 然 心 里 
有 点 虚 。 
颜色 感知 是 视觉 的 基本 功能 之 一 ， 也 是 智能 的 基本 元 素 之 一 。 可 是 ， 
颜色 从 何 而 来 呢 ? 为 什么 会 有 这 些 功 能 呢 ? 它 又 是 如 何 被 认 知 的 呢 ? 


颜色 的 来 源 

众所周知 ， 自 然 界 中 充斥 着 电磁 波 。 按 波长 由 短 到 长 来 划分 ， 电 磁 
波 包括 了 伽 马 射 线 、 和 X 射线、 紫外 线 、 可 见 光 、 红 外 线 、 无 线 电波 等 。 
与 整个 电磁 波谱 近 107^ 级 差 的 波长 范围 相 比 ， 可 见 光 的 波长 只 分 布 在 
380~760nm 之 间 ， 简 直 是 太 “ 宅 ”了 ， 如 图 9.1 所 示 。 而 偏偏 是 这 段 罕 得 
不 能 再 窗 的 波谱 ， 对 人 类 的 生存 和 智能 发 展 却 起 了 重要 作用 。 为 什么 人 类 
没有 选择 其 他 更 宽 的 波谱 来 形成 颜色 视觉 呢 ? 
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了 大 量 


此 温度 下 的 物体 
所 发 出 的 辐射 中 
最 强烈 部 分 的 波长 


一 种 解释 是 


的 远 红 外 线 、 


: 。 爱 犯错 的 智能 体 


BET UE 

Cy 
地 球 的 大 气 层 
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图 9.1 电磁 波谱 与 可 见 光 


:， 昌 然 自然 界 的 电磁 波 分 布 广泛 ， 但 由 于 大 气 的 保护 作用 ， 
如 臭氧 层 吸 收 了 大 量 对 大 多 数 生物 有 害 的 紫外 线 、 大 气 中 的 二 氧化 碳 吸收 


水 蒸气 吸收 了 近 红 外 和 微波 ,最终 能 进入 地 球 大 气 层 


并 到 达 地 面 的 太阳 辐射 便 以 可 见 光谱 范围 为 主 ， 如 图 9.2 所 示 。 而 人 类 在 演化 
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图 9.2 电磁波 在 进入 地 球 大 气 后 的 分 布 


中 就 选择 了 能 量 最 强 的 这 段 光谱 来 感知 世界 , 所 谓 人 择 原理 。 这 样 有 个 好 处 ， 
大 脑 不 用 分 析 和 处理 全 部 的 电磁 波谱 ， 因 而 可 以 大 幅度 节省 计算 资源 。 然 
而 ,同样 是 电磁 波 ， 只 是 波长 频率 上 的 不 同 ， 为 什么 只 有 可 见 光 能 呈现 颜 
色 呢 ? 
事实 上 这 样 表 述 也 不 是 完全 精准 ,因为 不 同 物种 感知 电磁 波 的 能 力 是 
不 同 的 ， 感受 的 颜色 也 有 细微 差异 。 比 如 蜜蜂 ， 据 说 由 于 复眼 的 原因 ， 蜜 
蜂 能 感受 更 短波 长 即 紫 外 线段 的 差异 。 结 果 ， 在 蜜蜂 的 眼 里 ， 白 色 的 花 可 
能 会 有 不 同 的 颜色 。 这 方便 蜜蜂 识别 不 同类 型 的 白花 ， 如 图 9.3 所 示 。 而 
众所周知 ， 习 惯 夜 里 活动 的 响尾蛇 则 能 通过 位 于 眼睛 和 鼻孔 之 间 的 “ 热 眼 ” 
感应 到 更 长 波段 的 红外 线 的 强度 变化 ， 以 此 来 区 分 活体 与 非 活体 。 


红外 线 红色 橙色 黄色 绿色 BE 紫色 紫外 线 
蜜蜂 


人 


图 9.3 ”蜜蜂 与 人 眼中 的 世界 
(a) 人 与 蜜蜂 视觉 的 差异 ; (b) 人 眼中 的 白花 (CE) 与 蜜蜂 眼中 的 白花 ( 右 ) 9 
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不 同 于 这 两 种 动物 ， 人 类 的 颜色 视觉 感知 范围 都 在 380—760nm 之 间 。 
按 波长 长 短 ， 粗 分 成 了 如 彩虹 的 “ 红 橙 黄 绿 蓝 靛 紫 ”的 颜色 变化 。 国 际 照 
明 协 会 甚至 给 出 了 无 法 通过 其 他 颜色 混合 而 成 的 相 加 三 基色 ( 图 9.4 )， 即 
红 、 绿 、 蓝 的 精确 波长 定义 ， 尽 管 每 个 基色 实际 都 有 一 定 的 变化 范围 。 考 
虑 到 打印 、 油画 的 颜色 是 通过 反射 感知 的 , 它 还 给 出 了 相 减 三 基色 ( 图 9.5 ), 
即 青色 、 品 红 、 黄 色 的 定义 。 


图 9.4 相 加 三 基色 图 9.5 相 减 三 基色 


R 一 红色 ; G 一 绿色 ; B 一 蓝 色 © 


青色 ; M 一 品 红 ; Y 一 黄色 
不 管 如 何 定 义 ， 人 类 对 颜色 的 感知 方式 基本 是 一 致 的 。 目 前 公认 的 是 
杨 — 赫 姆 霍 效 ( Young-Helmholtz ) 三 原色 学 说 ， 即 认为 视觉 系统 中 存在 对 


br 


2 WA 
£L. t 


蓝 三 基色 光线 特别 敏感 的 3 种 视 锥 细胞 或 相应 的 3 种 感光 色素 。 
其 他 颜色 的 光线 则 作用 于 这 3 种 视 锥 细胞 并 进行 混 色 ， 并 形成 相应 颜色 的 
感觉 ,该 学 说 解释 了 混 色 现象 的 原因 , 但 还 不 能 满意 地 说 明 色 盲 、 补 色 现 象 、 
负 后 像 等 现象 。 类 似 的 学 说 还 有 ， 也 无 法 形成 圆满 解答 。 另 外 ， 视 觉 神经 
元 对 三 基色 的 感知 的 敏感 差异 也 基本 相同 。 如 主要 负责 蓝 色 感知 的 视 蓝 素 ， 
虽然 总 量 少 ， 却 最 为 敏感 。 因 为 存在 这 些 一 致 性 , 颜色 感知 才能 有 利于 人 


ig 
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复杂 视觉 错觉 。 


类 形成 对 世界 大 抵 相同 的 认识 、 对 物体 的 共同 印象 和 概念 、 对 情绪 和 心理 
的 共同 感受 。 


颜色 的 功能 和 错觉 


如 果 人 类 只 能 感受 光线 的 强 弱 ， 而 无 法 感知 颜色 ， 那 必然 会 少 了 不 
少 能 力 和 乐趣 。 正 因为 有 了 颜色 的 感知 ， 人 类 在 智能 发 展 上 才 有 了 很 大 的 
提升 。 

第 一 个 重要 的 提升 是 对 目标 识别 能 力 的 改善 。 随 手 拍 张 照 片 ， 如 果 换 
成 黑白 色 ， 就 会 丢失 不 少 结构 信息 ， 甚 至 彩色 图 像 可 能 反映 出 来 的 深度 信 
息 也 会 损失 不 少 。 这 是 光 强 与 颜色 差异 的 区 别 。 不 仅 如 此 ， 从 视神经 元 的 
感受 能 力也 能 发 现 巨 大 的 差异 。 人 对 光 强 度 的 分 辨 能 力 一 般 在 20 个 灰 度 级 
左右 ,但 对 颜色 的 分 辨 力 却 能 升 高 好 几 次 数量 级 。 这 无 形 中 拉 大 的 目标 或 
物体 之 间 的 区 分 度 ， 为 人 类 提高 和 加 速 识别 目标 提供 了 有 利 条 件 。 

人 类 也 把 这 一 技术 应 用 到 计算 机 识别 任务 上 。 如 AlphaGo 直接 把 围棋 
的 棋盘 视 为 颜色 在 棋盘 上 的 分 布 ， 并 根据 分 布 来 判断 每 一 个 棋盘 的 输 说 。 
人 类 还 把 这 一 技术 用 到 原本 不 可 见 的 光谱 上 ， 如 机 场 的 XX 线 机 ， 帮 助 更 有 
效 地 分 辨 危险 物品 。 甚 至 用 于 声波 反射 构成 的 医疗 图 像 上 ， 如 给 B 超 图 像 
着 色 ， 形 成 伪 彩 色 ， 以 提高 医疗 诊断 的 可 辨识 能 力 和 有 效 性 。 

值得 指出 的 是 ， 颜 色 分 辩 能 力 在 男女 之 间 有 着 明显 的 差别 。 男 性 对 颜 
色 的 敏感 程度 ， 从 平均 意义 上 来 讲 ， 要 远 低 于 女性 。 打 个 不 恰当 、 和 夸张 的 
比方 ， 男 性 能 认 全 彩虹 里 的 “ 红 橙 黄 绿 蓝 靛 紫 ” 就 不 错 了 ， 女 性 却 可 能 认 
识 上 千 种 颜色 。 不 信 的 话 ， 女 性 同胞 们 可 以 把 图 9.6 中 不 同 种 类 的 口红 颜 
色 让 男性 朋友 辨别 下 。 

不 过 颜色 认得 少 也 不 见得 全 是 坏事 ， 比 如 怕 “ 鬼 ”的 多 是 女性 ， 有 可 
能 就 与 颜色 看 得 太 多 、 容 易 产 生 的 联想 更 丰富 有 关 。 为 什么 要 在 智能 体 上 
形成 性 别 差异 明显 的 颜色 感知 呢 ? 
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有 一 点 可 以 肯定 的 是 ， 颜 色 会 
影响 人 类 情感 的 表达 ， 甚 至 影响 心 
理 的 反应 。 不 然 ， 买 那么 多 种 口红 
就 没 意 义 了 。 事 实 上 ， 某 些 颜 色 还 
会 导致 血压 的 升 高 、 加 速 新 陈 代谢 
和 导致 眼睛 疲劳 。 比 如 红色 会 让 人 
感觉 激动 ， 蓝 色 会 让 人 心情 平静 ， 
白色 则 象征 纯洁 。 不 同 的 色彩 也 能 
影响 人 对 观察 到 的 事件 的 判断 ， 甚 

给 出 截然 相反 的 结论 ， 如 图 9.7 
所 示 的 着 色 。 颜 色 有 的 时 候 还 可 以 
帮助 掩饰 真实 情感 ， 如 用 艳丽 的 口红 来 掩饰 不 愉快 的 心情 。 


图 9.6 不 同 种 类 的 口红 


图 9.7 颜色 的 误导 : 救 人 还 是 打 人 ? 


除 此 以 外 ， 颜 色 对 于 图 像 高 层 语义 的 表达 也 很 重要 。 在 摄影 作品 中 ， 
有 时 为 了 追求 特殊 的 美感 ， 会 有 意 将 照片 的 颜色 褪去 ， 以 形成 所 谓 的 高 调 、 
低调 的 黑白 照片 。 但 在 多 数 情况 下 ， 彩 色 照 片 仍然 占 主导 地 位 。 在 彩色 图 
像 上 同一 场景 颜色 明暗 的 变化 会 导致 不 同 的 感受 ， 如 图 9.8 所 示 。 该 图 只 
是 在 颜色 的 明暗 上 做 了 些微 变化 ， 就 影响 了 对 图 像 中 人 物 心情 是 忧郁 还 是 


66 


略 显 阳光 的 判断 。 


图 9.8 不 同 光照 条 件 下 人 物 心情 的 解说 也 不 同 


另外 ， 现 有 的 与 人 工 智 能 相关 的 诸多 应 用 ， 都 要 考虑 对 颜色 的 处 理 。 
如 图 像 修复 (image inpainting ) 中 ， 需 要 考虑 缺失 部 分 与 未 缺失 图 像 之 间 
颜色 的 一 致 性 ; 图 像 标注 (image captioning ) 任务 需要 考虑 颜色 带 来 的 意 
境 变化 。 

值得 指出 的 是 ,古往今来 的 文人 墨客 从 不 音 埋 用 笔墨 来 描绘 五 彩 斑 测 
的 颜色 。 举 例 来 说 ， 和 鲁迅 在 《 雪 》 中 ， 就 寒冬 时 节 花 草 说 过 : 

雪 野 中 有 血红 的 宝珠 山茶 ， 和 白 中 隐 青 的 单 淮 梅花 ， 深 黄 的 芯 口 的 蜡 梅 
花 ; 雪 下 面 还 有 冷 绿 的 杂 草 。 

寥寥 数 笔 ， 一 幅 有 颜色 的 画面 便 跃然 纸 上 。 试 想 ， 如 果 没 有 颜色 ,由 
智能 体 、 人 类 撰写 的 文学 作品 肯定 会 逊色 不 少 。 

抽象 颜色 的 认 知 

既然 颜色 在 智能 体 中 起 了 如 此 广泛 、 重 要 的 作用 ， 颜 色 的 辨识 又 是 在 
何 时 被 固化 到 人 的 视觉 中 枢 呢 ? 

要 回答 这 一 问题 ， 还 可 以 先 问 另 一 个 问题 。 有 多 少 人 观察 过 儿童 的 发 
育 ， 观 察 过 儿童 在 不 同年 龄 阶段 对 物体 、 概 念 的 学 习 能 力 呢 ? 

我 兽 对 某 儿 童 的 成 长 进行 过 长 时 间 的 观察 。 从 个 人 的 经 验 来 看 ， 颜 色 
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是 儿童 在 1 岁 以 后 才能 学 会 和 理解 的 。 有 别 于 有 形 物 体 的 学 习 ， 颜 色 在 早 
期 发 育 中 是 比较 难以 掌握 的 概念 ， 因 为 它 是 触 不 着 、 摸 不 到 的 。 

在 儿童 最 开始 的 物体 学 习 阶 段 ， 触 摸 很 重要 ， 因 为 即使 是 同样 的 物体 ， 
如 果 不 去 触摸 ， 人 也 会 产生 不 同 的 视觉 感知 ， 如 受 观 察 角 度 的 影响 、 受 透 
视角 的 影响 等 。 通 过 触摸 ， 可 以 完成 消 上层 ， 得 到 唯一 的 概念 标签 。 

然而 ,颜色 却 是 无 法 触摸 的 。 在 父母 通过 听觉 系统 向 小 孩 传授 这 一 概 
念 的 时 候 ， 小 朋友 只 能 依赖 视觉 获取 的 信息 来 推测 。 但 听觉 信息 传授 的 概 
念 具 有 很 强 的 多 义 性 ， 比 如 说 一 堵 墙 是 红色 的 。 小 朋友 在 无 法 触摸 颜色 时 ， 
即使 父母 通过 手势 来 辅助 传授 ,他 /她 也 并 不 会 清楚 红色 是 特 指 什么 ， 尤 
其 在 他 /她 已 经 习惯 了 通过 触摸 来 帮助 学 习 物体 的 时 候 。 通 过 这 个 观察 ， 
我 发 现 颜色 尽管 是 能 看 到 的 , 却 是 相对 抽象 的 、 略为 高 级 的 语义 信息 ,结果 ， 
这 个 抽象 的 颜色 ， 需 要 花 比 学 习 实 际 物体 更 长 的 时 间 来 学 习 ， 才 能 形成 准 
确 的 抽象 概念 表征 。 同 时 ， 抽 象 的 特点 也 使 得 颜色 的 认 知 往往 会 滞后 于 实 
体 目 标的 学 习 。 

不 难看 出 ， 识 别 颜色 的 能 力 尽管 与 生 俱 来 ,但 最 终 还 是 通过 传授 
完成 概念 的 标定 ， 并 形成 与 其 他 人 在 认 知 上 的 统一 。 然 而 ， 值 得 注意 
的 是 ， 这 种 认 知 上 的 统一 ， 并 不 能 解决 因为 基因 或 病理 原因 引起 的 色 育 
问题 (图 9.9 )， 甚 至 可 能 导致 危险 。 比 如 我 们 常见 的 红色 色盲 患者 ， 其 在 
颜色 的 感知 上 对 红色 与 绿色 几乎 是 没有 区 分 的 。 但 是 ， 这 并 不 意味 着 他 在 
熟悉 的 场所 区 分 不 了 这 两 种 颜色 。 因 为 ,在 儿童 期 的 颜色 学 习 时 ， 父 母 会 
通过 听觉 和 手势 来 帮助 区 分 颜色 所 处 的 位 置 。 红 绿灯 尽管 颜色 感知 相似 ， 
但 在 交通 灯 的 位 置 往往 是 不 同 且 相对 固定 的 。 所 以 ， 在 熟悉 地 段 ， 红 色色 
育 患 者 是 能 正常 生活 和 遵守 交通 规则 的 。 但 在 陌生 地 方 ， 如 果 红绿灯 位 置 
产生 变化 ， 那 红 /绿色 盲 患者 就 很 难 区 分 ， 就 容易 发 生 交 通 危险 了 。 除 此 
以 外 ， 色盲 患 者 在 理解 艺术 作品 中 的 情绪 、 美 感 上 也 会 产生 严重 的 偏差 。 
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当然 ， 如 近视 眼 画 家 创造 的 印象 派 一 样 ， 也 不 排除 色盲 患者 会 画 出 不 同 常 
人 、 别 具 一 格 的 杰作 。 
从 以 上 例子 可 以 看 出 ， 人 类 对 颜色 甚至 知识 的 学 习 似 乎 是 从 具体 到 抽 
象 逐 渐 过 渡 的 ， 而 不 会 一 开始 就 接触 非常 抽象 的 概念 。 如 果 想 建构 一 个 拟 
人 的 智能 体 ， 是 否 也 应 该 遵循 这 一 原则 呢 ? 是 否 不 应 该 从 相对 于 视觉 更 为 
抽象 的 自然 语言 处 理 开始 着 手 呢 ? 


人 和 群 的 比例 
92% cc: MEC GENI 
2.7% 225 DD ia 
0.66% aen i | 
0.59% ob mz! 
0.56% OE E E —1 BP — 
0.016% BAB E —  Á — | 
0.01% ies å ~ S 
<0.0001% on ED —  ——| 


图 9.9 不 同色 讶 与 正常 视觉 对 颜色 感知 的 对 比 图 和 人 和 群 比例 


而 作为 人 工 智能 的 研究 者 和 爱好 者 ， 不 妨 也 观察 下 ， 自 己 的 小 孩 什么 
时 候 能 学 会 判断 颜色 ?是 否 比 学 习 实 体 的 概念 更 困难 ? 观察 新 生 儿 的 发 育 
过 程 ， 尤 其 是 0-3 岁 时 期 的 ， 很 可 能 对 人 的 智能 发 育 形 成 更 直接 、 一 手 的 
了 解 。 如 果 多 些 人 去 尝试 ， 也 许 能 得 到 很 多 统计 意义 上 的 、 关 于 智能 的 新 
的 发 现 。 
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=) 自 举 的 视觉 与 智能 


图 10.1 敏 豪 生 抓 着 自己 的 头发 把 马 和 自己 从 泥沼 里 拔 出 来 


put 


鼻子 又 高 又 长 的 小 个 子 干 瘦 老 头 敏 豪 生 又 讲 起 了 他 的 奇妙 故 寻 
在 乎 大 家 是 否 相信 : 
一 次 ， 我 们 受到 凶猛 追击 。 我 决定 骑马 穿 过 沼泽 地 。 然 而 ， 我 的 马匹 


, EA 
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跑 得 太 累 了 ， 没 能 跳 过 本 可 跳 过 的 沼泽 泥 淖 ， 号 的 一 声 陷 入 泥沼 ， 动 弹 
不 得 。 

泥 淖 把 我 们 越 来 越 深 地 往 下 吸 、 往 下 拉 ， 眼 看 着 马 整个 陷 进 了 险恶 的 
泥 淖 里 。 很 快 ， 我 的 头 也 开始 埋 进 沼泽 的 污 泥 之 中 。 只 有 我 头顶 军官 帽 还 
露 在 泥 淖 上 面 。 

眼看 就 没 救 了 。 幸 好 我 急中生智 ， 一 把 抓 起 我 自己 的 头发 ， 用 尽 全 身 
的 力气 把 自己 往 上 搜 。 我 毫 不 费力 地 把 自己 从 泥 淖 中 拔 了 出 来 ， 而 且 顺 带 
还 把 我 的 马 也 往 上 搜 。 我 的 双 腿 也 如 铁 钧 一 般 的 强 有 力 ， 把 马 肚 拔 了 出 来 。 

这 可 不 是 一 件 轻 而 易 举 的 事 哟 ! 要 不 信 ， 你 们 自 个 儿 试 试 ， 看 能 不 能 
抓 住 自己 的 头发 一 下 就 把 自己 提 向 空中 。 

一 一 摘自 《 敏 豪 生 奇 游记 》 

《人 敏 豪 生 奇 游记 》 原 为 德国 民间 故事 ， 又 名 《吹牛 大 王 历险 记 》 后 由 
德国 埃 ' 拉 斯 伯 和 戈 ， 毕 尔格 两 位 作家 再 创作 而 成 。 这 则 故事 传递 了 一 个 
概念 ， 叫 “ 自 举 "， 能 找到 的 对 应 英文 名 是 Bootstrap, SEE to pull oneself 
up by one’s bootstrap, 白话 就 是 “ 拔 鞋 法 "。 在 这 个 故事 里 , 敏 豪 生 通 过 “ 自 
举 ” 逃 出 了 沼泽 ， 安 全 地 进入 了 下 一 个 吹牛 环节 。 看 似 挺 荒 廖 的 情节 ， 那 
在 智能 体 和 人 工 智能 领域 有 没有 类 似 的 存在 呢 ? 


自 举 的 视觉 

不 得 不 用 到 自 举 ， 无 非 是 自身 的 能 力 受 限 ， 才 得 想 办 法 扩展 。 人 的 视 
觉 就 是 如 此 ， 在 很 多 方面 不 是 那么 尽 如 人 意 的 。 它 不 如 鹰 的 眼睛 那么 敏锐 ， 
其 能 在 运动 状态 下 从 10 千 米 的 高 空 及 时 准确 地 发 现 草丛 里 的 猎物 ， 也 不 如 
蜜蜂 能 区 分 紫外 线 波段 白色 花 的 差异 ， 也 不 能 像 响尾蛇 一 样 感受 红外 端的 
热能 。 

不 过 人 也 有 一 些 奇 特 的 感知 能 力 ， 比 如 传说 中 的 “第 三 只 眼 ”“ 背 后 的 
眼睛 "， 有 科学 家 将 其 称 为 盲 视 ， 即 身体 上 的 其 他 感 观 系统 感受 到 了 周边 潜 


71 


;” 爱 犯错 的 智能 体 


在 的 变化 ， 却 没有 经 过 视 皮 层 的 脑 区 进行 加 工 产生 的 下 意识 反应 ， 但 人 会 
“以 为 ”自己 看 到 了 。 尤 其 是 女性 ， 可 能 冷 不 丁 会 觉得 背后 有 人 在 看 她 ， 而 
且 经 常 发 现 感觉 是 对 的 ， 这 说 不 定 就 与 “ 盲 视 ”有 关 。 世 界 著名 的 漫画 书 
《丁丁 历险 记 》 之 《 蓝 莲花 》 也 描绘 过 这 种 “ 育 视 ”的 情形 (图 10.2 )。 当 然 ， 
这 些 “ 盲 视 ” 的 情况 也 可 能 是 心理 作用 引起 的 ， 目 前 并 无 定论 。 


图 10.2 双胞胎 侦探 杜邦 、 杜 帮 ( 英文 原名 为 : Thompson & Thomson ) 和 丁丁 在 
1937 年 左右 的 上 海 街头 ( 取 自 《丁丁 历险 记 》 之 《 蓝 莲花 》) 


不 管 是 否 有 神奇 能 力 ， 人 的 视觉 有 很 多 不 足 。 在 光 的 强度 上 只 能 感受 
10° 量 级 的 变化 ， 而 自然 界 的 光 强 的 量 级 是 从 10”~ 105, jm 107 量 级 的 变 
化 。 于 是 , 人 的 视觉 多 了 个 “亮度 自 适 应 "的 自 举 功能 。 这 是 人 最 常用 的 能 力 。 
比如 走 进 电影 院 时 ， 开 始 眼前 一 片 漆黑 ， 过 了 一 段 时 间 ， 人 的 眼睛 逐渐 适应 
Y. 便 能 看 清楚 周边 的 环境 了 。 更 严格 地 话 ， 这 一 能 力 可 用 图 10.3 来 说 明 。 

图 10.3 中 横 坐 标 是 光 强 的 对 数 ， 即 10 个 数量 级 ; 纵 坐 标 反映 了 人 眼 
的 适应 能 力 以 及 主观 感受 的 亮度 变化 。 和 白昼 视觉 (photopic ) 的 感光 范围 从 
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10°~10', RUM (scotopic) 从 


RARR --- 
10s_10"。 人 的 视觉 可 在 给 定 图 中 
B, 处 的 强度 值 时 ， 在 B, 处 的 正 久 
区 间 内 形成 可 见 的 视觉 感知 。 但 
是 ， 人 了 眼 能 够 根据 B, 的 变化 进行 Ae 
一 定 范围 的 可 视 能 力 自 适应 。-- "qm 


且 到 了 夜 视觉 区 间 时 ， 视 力 会 按 
夜 视觉 的 曲线 来 感知 环境 。 
人 类 亮度 自 适 应 的 机 制 是 什 暗 视 阔 值 一 


s 4-20 2 4 


Awe? CARL A ST FL 光 强 的 对 数 / mL 


的 大 小 来 适应 不 同 的 光照 变化 的 。” 图 10.3 亮度 自 适应 ;和 白 尽 视觉 与 夜 视觉 [四 
机 制 不 同 ， 是 通过 后 端的 视神经 
元 的 分 工 协作 来 实现 的 。 白 昼 视 觉 主要 由 光线 落 在 视网膜 焦点 C HI rp pul ) 
处 的 视 锥 细胞 完成 ， 夜 视觉 则 由 主要 分 布 在 中 央 四 以 外 的 视 杆 细 胞 来 实现 。 

别 小 看 这 点 自 适应 ， 现 在 的 图 像 处 理 在 处 理光 强 差 异 大 的 场景 时 仍然 
是 一 筹 莫 展 。 比 如 白天 ， 各 位 不 妨 拿手 机 从 室内 拍 下 室外 的 场景 ， 看 看 是 
否 能 保证 室内 室外 都 成 像 清晰 、 明 上 暗 分 明 ? 再 比如 ， 在 地 下 停车 场 的 外 面 ， 
摄像 头 是 否 能 把 停车 场 里 外 都 同时 监测 ? 

当然 ， 这 种 自 适 应 有 时 候 也 会 带 来 风险 。 比 如 在 晚上 开车 ， 突 然 对 面 
来 了 一 辆 开 着 远 光 灯 的 车 ， 那 么 驾驶 员 在 视觉 上 会 直接 被 误导 到 白昼 视觉 ， 
而 无 法 看 清 黑暗 环境 里 的 人 或 其 他 目标 。 这 种 “瞬间 致 育 ” 极 易 导 致 交通 
意外 的 发 生 。 

除 此 以 外 ， 人 的 视觉 对 边缘 的 反应 也 有 自 举 的 表现 。 图 10.4 是 一 组 光 
的 强度 按 宽度 逐渐 变化 构成 的 。 将 其 强度 的 柱状 图 画 出 来 ， 就 像 一 组 台阶 。 
然而 ， 有 实验 表明 ， 人 在 感知 时 会 在 两 个 相 邻 的 强度 级 的 连接 处 产生 “ 感 
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受到 ”的 向 上 和 向 下 的 强度 变化 , 称 之 为 “马赫 效应 ”, 可 以 称 其 为 伪 边 缘 。 
这 种 伪 边 缘 的 出 现 ， 可 拉 开 相 邻 目标 或 前 景 、 背 景 之 间 的 差异 ， 使 轮廓 变 
得 更 清晰 ， 继 而 能 帮助 人 类 更 好 地 区 分 目标 和 背景 或 其 他 目标 。 

然而 ， 马 赫 效 应 形成 的 伪 边 缘 有 时 候 也 能 产生 错觉 。 比 如 图 10.5 这 张 
戴 着 金属 矫正 装置 的 牙齿 和 X 线 片 。 如 果 不 熟 悉 牙 齿 的 基本 构造 ， 一 个 刚 上 
岗 的 义 线 片 读 片 员 很 容易 对 这 些 牙 具 得 出 假 阳 性 的 诊断 结果 。 因 为 矫正 装 
置 与 牙齿 的 牙 釉质 和 牙 本 质 相 比 ， 具 有 更 高 的 密度 ， 因 为 在 感光 后 会 由 于 
马赫 效应 在 牙齿 上 形成 伪 影 ， 导致 经 验 不 足 的 医生 产生 误 判 ， 需 要 结合 临 
床 判断 。 


图 10.4 马赫 效应 Un 图 10.5 牙齿 入 线 片 MS 


不 仅 相 邻 黑 、 白 、 灰 度 的 差异 会 形成 边缘 错觉 ， 相 邻 亮 度 、 颜 色 的 对 
比 还 会 形成 对 亮度 和 色彩 的 判断 错觉 ， 如 图 10.6 所 示 。 图 像 处 理 领 域 将 其 
称 为 “同时 对 比 ” 现 象 ， 也 有 些 领 域 将 其 称 为 “色彩 错觉 "。 其 原因 在 于 人 
的 视觉 系统 易 受 周围 环境 色彩 的 影响 ,在 色彩 对 比 因素 存 在 的 前 提 下 ， 对 
关注 的 色彩 或 灰 度 产生 深浅 不 一 的 错觉 。 从 某 种 意义 来 讲 ， 这 种 错觉 可 能 
是 为 了 提升 人 对 所 关注 目标 的 显著 程度 而 形成 。 不 过 ， 负 面 效果 就 是 不 容 
易 形 成 统一 的 色 视 觉 判 定 结论 ， 因 为 人 的 色彩 视觉 是 主观 而 非 客 观 的 ， 比 
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如 图 10.7 中 的 连衣裙 的 条 纹 是 何 颜色 呢 ? 事实 上 ， 即 使 最 后 设计 师 明 确 了 
连衣裙 的 颜色 ®, 仍然 没有 终止 人 们 对 视觉 和 颜色 的 争论 。 它 表明 人 类 色觉 
是 存在 差异 的 ， 它 也 成 为 了 神经 科学 和 视觉 科学 的 新 的 科研 方向 ， 有 很 多 
相关 的 论文 已 经 在 科学 期 刊 上 发 表 。 
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图 10.6 同时 对 比 现象 
(a) 灰 度 图 的 同时 对 比 (俗称 : Checker Shadow illusion， 棋 盘 阴 影 错觉 ) ; 
(b) 彩色 图 的 同时 对 比 


自 举 的 人 工 智能 方法 

人 类 的 视觉 系统 能 通过 自 举 来 提高 感知 外 
部 世界 的 能 力 ， 那 么 人 工 智 能 中 有 没有 类 似 的 
机 制 呢 ? 

从 现 有 的 理论 体系 来 看 ， 在 数据 的 分 布 方面 
存在 自 举 式 模拟 ， 分 布 加 权 以 及 数据 不 足 时 也 存 
在 自 举 的 办 法 ， 但 这 些 都 与 视觉 中 的 自 举 大 相 径 
庭 。 具体 如 下 : 


图 10.7 连衣裙 条 纹 是 什 


1. 数据 分 布 的 自 举 么 颜色 的 ? 自 
实现 人 工 智能 的 一 个 必要 步骤 是 学 习 ， 从 数 色 与 金色 ， 还 是 
黑色 与 蓝 色 ? 


据 中 学 习 。 但 数据 的 分 布 是 什么 样 的 呢 ? 并 非 一 


OD 实际 颜色 为 黑色 与 蓝 色 。 


EE ET ES 


开始 就 明了 。 所 以 ， 一 般 会 假设 数据 服从 某 个 分 布 。 比 如 像 许愿 池 中 扔 的 硬 
币 一 样 (图 10.8 )， 中 间 密 周边 逐渐 稀少 ， 这 就 是 传说 中 的 人 工 智能 领域 最 
常用 的 高 斯 分 布 , 因为 它 能 极 大 方便 随后 的 各 种 处 理 , 如 优化 和 梯度 计算 等 。 

可 是 分 布 是 多 种 多 样 的 ， 也 并 非 所 有 情况 下 ， 分 布 都 能 精确 且 事先 知 
道 。 但 做 数据 分 析 或 设计 人 工 智能 算法 时 又 需要 有 分 布 的 形式 ， 于 是 科学 
家 们 就 设计 了 一 种 自 举 的 技术 去 逼近 真实 的 分 布 。 粗 略 来 说 ， 就 像 玩 扑 到 
牌 一 样 ， 每 次 抽 完 牌 再 放 回去 。 在 给 定 了 牌 /数据 的 前 提 下 ， 通 过 对 牌 / 数 
据 进行 反复 的 抽样 ， 每 次 都 有 放 回 地 抽 一 组 和 原始 牌 /数据 数量 相同 的 数 
据 ， 获 得 的 数据 集 称 为 自 举 或 再 抽样 样本 集 。 

重复 这 一 自 举 方式 ， 通 过 分 析 其 稳定 性 ， 就 能 比较 好 地 逼近 数据 的 真 
实 分 布 。 这 是 数据 分 布 的 自 举 ， 称 为 Bootstrap 方法 ( 也 称 自助 法 )， 最 初 
由 美国 斯 坦 福 大 学 统计 学 教授 埃 弗 隆 (Efron) 在 1979 年 提出 ， 为 小 样本 
或 小 数据 量 来 增 广 样本 提供 了 好 方法 所 。 在 此 基础 上 ， 后 来 发 展 了 大 量 的 
改进 型 “ 自 举 ”方法 ， 都 是 期 望 能 更 好 地 从 局 部 推测 总 体 的 分 布 。 


图 10.8 MPA RMA Ghat: 南京 ， 侵 华 日 军 南京 大 属 杀 遇 难 同胞 
纪念 馆 西 侧 和 平公 园 的 水 池 ) 


2. 基于 数据 分 布 加 权 的 自 举 
另 一 类 自 举 是 针对 分 类 任务 的 ， 比 如 识别 张 三 和 李 四 的 人 脸 图 像 。 传 
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复杂 视觉 错觉 。 


统 的 方法 往往 假定 每 张 图 像 或 数据 在 分 布 中 是 等 权重 的 。 这 种 假设 的 不 足 
在 于 ， 不 容易 区 分 容易 分 错 的 数据 。 于 是 1995 AER - 弗 洛 德 (Yoav 
Freund ) 就 提出 了 Boosting 算法 ， 通 过 同时 组 合 多 个 较 弱 分 类 能 力 的 分 类 
器 来 改进 分 类 性 能 外。1996 年 在 此 基础 上 弗 洛 德 和 夏 皮尔 ( Schapire ) 提 
出 了 当年 红 遍 机 器 学 习 界 及 相关 领域 的 Adaboost 算法 外。 基于 多 个 弱 分 
类 器 的 集成 ， 该 算法 实现 了 优异 的 预测 性 能 。 在 此 背后 ， 一 个 最 重要 的 原 
因 就 是 它 会 根据 每 个 弱 分 类 器 的 预测 情况 ， 对 容易 分 错 的 样本 给 予 更 高 的 
权重 ， 从 而 确保 其 在 下 一 轮 采 样 时 更 容易 出 现 或 被 采集 到 ， 直 到 获得 精确 
的 预测 结果 。 这 个 针对 数据 错 分 的 自 举 ， 最 终 成 为 了 机 需 学 习 最 成 功 且 实 
用 的 经 典 算 法 之 一 。 至 于 其 在 分 类 能 力 上 成 功 的 机 制 ， 尽 管 机 器 学 习 的 著 
名 期 刊 IMLR ( Journal of Machine Learning Research 多 机 器 学 习 研 究 杂 志 》) 
曾 有 一 批 学 者 来 进行 多 角度 的 分 析 。 真 实 和 公认 的 原因 仍 未 知 ， 但 其 与 自 
举 相 关 是 考 良 置疑 的 。 

3. 数据 不 足 的 对 抗 自 举 

为 了 能 进一步 提高 深度 网 络 的 性 能 伊 恩 .上古 德 费 洛 (Ian 
Goodfellow ) 于 2014 年 提出 了 生成 式 对 抗 网 络 中 。 一 经 提出 ， 很 快 就 成 为 
人 工 智能 领域 研究 者 的 主要 研发 工具 之 一 。 如 果 仔 细 审 视 ， 可 以 发 现 ， 其 
通过 网 络 内 部 对 抗 器 和 判别 器 的 反复 博弈 生成 大 量 “ 虚 拟 样本 ”的 思路 ， 
也 能 视 为 是 一 种 自 举 。 

比较 有 趣 的 是 ， 在 取得 异常 好 的 性 能 的 同时 ， 这 种 自 举 式 的 网 络 和 
其 他 深度 网 络 似乎 都 容易 被 攻击 。 据 报道 ， 对 于 图 像 识 别 任务 ， 一 两 个 像 
素 的 改变 或 引入 随机 噪声 所 构成 的 对 抗 样本 就 能 导致 网 络 产生 错误 识别 
( 图 10.9 )。 这 多 少 有 点 像 自 举 的 视觉 ， 会 存在 “同时 对 比 ” 这 种 容易 误导 
视觉 判断 的 现象 。 毕 竟 没 有 什么 系统 是 十 全 十 美的 ， 总 会 有 例外 。 只 是 我 
们 还 不 太 清 楚 ， 这 是 否 仅 是 稀少 的 例外 ， 还 是 会 变 “ 黑 天 鹅 ” 的 意外 。 
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“熊猫” ErrTT 
57.7% 置信 度 99.3% 置信 度 


A 10.9 易 受 攻击 的 深度 网 络 : 能 猫 上 有 登 加 随机 骂 声 ， 尽 管 视觉 上 仍 能 察觉 是 能 猫 的 
图 像 ， 但 深度 网 络 却 会 高 置信 度 ( confidence ) 地 将 其 识别 为 长 臂 猿 加 


自 举 的 心智 

人 工 智 能 的 终极 目标 是 期 望 能 模拟 人 类 的 智能 ， 所 以 ， 自 举 的 心智 也 
是 值得 研究 的 ， 因 为 它 意 味 着 人 能 在 受 限 的 条 件 下 极 大 地 提高 自身 的 能 力 。 
这 有 点 像 俗话 所 说 的 “走出 自己 的 舒适 圈 ”。 

关于 这 一 点 ，20 世纪 初期 哲学 家 怀 海德 曾 在 其 1929 年 出 版 的 、 形 而 
上 学 或 “过 程 哲学 ”经 典 书籍 Process and Reality ( 过程 与 实在 》) 中 指出 ， 
人 的 认 知 、 社 会 的 认 知 最 终 可 以 上 升 到 一 种 自我 成 长 、 自 我 成 熟 的 阶段 ， 
正如 宇宙 和 自然 的 演化 ， 这 可 以 被 视 为 更 广义 的 自 举 0. 

而 经 济 学 家 默 顿 . 米 勒 提出 的 默 顿 定律 (Merton Laws ) 认为 ， 人 最 理 
想 的 状态 是 自我 预言 、 自 我 实习 。 举 个 有 趣 的 例子 ， 据 说 杨振宁 在 12 岁 时 
就 爱 看 物理 书 。 有 一 次 他 从 艾 迪 顿 的 《神秘 的 宇宙 》 里 读 到 了 一 些 新 的 物 
理学 现象 与 理论 ， 便 表现 了 极 大 的 兴趣 。 回 家 后 就 跟 父 母 开 玩笑 说 ， 将 来 
要 拿 诺 贝尔 奖 。 结 果 梦 想 真 的 实现 了 。 这 就 是 默 顿 定律 的 体现 ， 是 一 种 自 
我 预言 、 自 我 激励 、 自 我 实现 ， 也 是 一 种 自 举 的 表现 。 

如 果 把 自 举 的 机 制 理解 清楚 了 ， 尤 其 是 视觉 和 心智 方面 的 ， 也 许 我 们 
就 能 找到 构造 自我 发 育 、 自 我 强化 的 人 工 智能 体 的 办 法 了 。 
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=@ 主观 时 间 与 运动 错觉 


混沌 初 开 ， 乾坤 始 英 。 气 之 轻 清 上 浮 者 为 天 ， 气 之 重 浊 

下 凝 者 为 地 。 

这 是 明 末 的 启蒙 书 《 幼 学 琼 林 》 中 的 开篇 ， 它 揣测 了 空间 和 时 间 的 开 
始 状 态 。 其 中 乾坤 意 指 天 地 和 阴阳 ， 而 阴阳 的 解读 是 时 间 。 所 谓 “ 天 干 ， 
犹 木 之 干 ， 强 而 为 阳 ; 地 支 ， 犹 木 之 枝 ， 弱 而 为 阴 ",， (+) 天 干 (十 二 ) 
地 支 是 古代 纪年 历法 的 组 成 ， 在 殷墟 的 甲骨 文 就 有 记载 。 

我 们 现在 常 说 的 宇 害 ， 和 乾坤 是 同 义 的 。 宇 指 上 下 四 方 ， 是 空间 。 宙 
指 古 往 今 来 ,是 时 间 ， 合 起 来 就 是 空 时 。 不 过 这 么 说 比较 抛 口 ， 所 以 人 们 
一 般 认 为 宇宙 字面 上 是 对 应 时 空 。 

空间 是 客观 存在 的 ， 人 的 视觉 却 是 主观 的 ， 所 以 人 的 能 动 性 在 增强 对 
空间 感知 能 力 的 同时 ， 会 产生 错觉 。 时 间 也 是 客观 存在 的 ， 且 是 单 向 的 ， 
目前 一 直 在 向 前 。 不 过 在 爱 因 斯 坦 的 狭义 相对 论 里 ， 时 间 并 非 是 完全 孤立 
的 变量 。 按 其 公式 推算 ， 当 飞船 以 近 光 速 进 行星 际 旅行 时 ， 飞 船上 的 时 间 
会 变 慢 。 所 以 ， 才 会 有 如 图 11.1 标题 所 示 的 双生 子 伴 嚣 。 因 为 时 间 并 非 绝 
对 的 ， 它 受 运动 速度 的 影响 。 不 仅 如 此 ， 人 也 会 对 时 间 产 生 主 观 的 感受 。 
成 语 中 有 “ 度 日 如 年 ”的 描述 , 这 在 课堂 上 听 不 懂 老 师 讲课 内 容 时 尤为 常见 ， 
我 在 中 学 时 代 对 此 感受 颇 深 。 
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时 间 的 主观 感受 不 仅 会 让 时 
间 变 “ 慢 ”, 也 可 能 会 产生 “逆向 ” 
的 时 间 错 觉 。 因 为 运动 与 时 间 的 
变化 相关 ， 时 间 感 受 的 主观 性 又 
直接 影响 了 对 运动 的 感受 ， 形 成 
了 运动 错觉 ， 它 直接 影响 了 智能 ”网 
体 对 世界 的 某 些 感知 。 (a) (b) 


图 11.1. 双生 子 伴 廖 (twin paradox) 。 假 
zarje 
Sata A 如 有 一 对 双胞胎 ， 一 个 乘 飞船 近 


光速 飞行 ,一 段 时 间 后 返回 地 球 ， 
另 一 个 则 留 在 地 球 。 两 个 人 都 发 


运动 错觉 He Ts 常 指 “ 在 一 ER 条 件 


下 将 客观 静止 的 物体 看 成 运动 的 现 对 方 在 以 近 光 速 移动 ， 按 相对 
觉 ”， 但 更 广义 来 看 ， 它 包含 了 论 时 间 会 变 慢 , 因此 会 衰老 慢 些 


那 到 底 谁 会 更 老 呢 ? 


apr n > A tee E 
时 间 主 观感 觉 引发 的 错觉 。 因 此 ， (a) 1904 年 的 爱 因 斯 坦 ，25 岁 ; 
这 类 错觉 既 有 源 自 静止 目标 的 运 (b) 1947 年 的 爱 因 斯 坦 ，68 岁 


动 错觉 ， 也 有 源 自 运 动 目标 的 运 
动 错觉 。 从 文献 来 看 ， 前 者 又 可 细 分 为 4 种 错觉 : 动 景 运动 、 自 主 运动 、 
诱导 运动 和 运动 后 效 0. 

动 景 运动 与 人 的 视觉 暂 留 现 象 persistence of vision) AK, 也 称 为 “ 余 
HERY”, JÈ 1824 年 由 英国 伦敦 大 学 教授 皮特 ' 马克 罗 葛 特 在 《移动 物 
体 的 视觉 暂 留 现象 》 中 最 早 提出 的 。 如 其 他 错觉 一 样 ,“ 视 觉 暂 留 ”的 内 在 
机 制 ， 是 以 大 脑 为 中 心 还 是 以 眼睛 为 中 心 产生 的 ， 并 没有 得 到 统一 的 结论 。 
但 其 现象 大 致 可 以 描述 成 ， 人 眼 在 观察 物体 时 ， 光 信号 在 传人 大 脑 视觉 中 
枢 时 ， 需 要 经 过 一 个 短暂 的 时 间 。 而 在 光 信号 结束 后 ， 由 于 视神经 的 反应 
速度 和 惰性 ， 视 觉 形 象 并 不 会 马上 消失 ， 而 是 会 继续 在 时 间 轴 上 延长 存储 
一 段 时 间 。 这 种 残留 的 视觉 称 为 “后 像 ”， 而 这 个 现象 则 称 为 “视觉 暂 留 ”。 

它 在 很 多 场合 都 有 着 有 意思 或 重要 的 应 用 。 最 早 有 记载 的 是 宋代 的 走 
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马 灯 ， 如 图 11.2 所 示 。 据 说 当年 
王安石 在 科 场 上 对 主考 官 出 的 联 
“ 飞 虎 旗 ， 旗 飞 虎 , 旗 卷 虎 藏 身 ”， 
便 是 以 其 在 马 员外 门口 看 到 的 联 
SEDIT, IED, IEDF” 
来 应 对 的 ， 最 终 还 因此 娶 了 马 员 
外 的 女儿 ， 情 场 考场 双 得 意 。 如 
今 我 们 看 的 电影 和 动画 ， 都 与 视 
觉 暂 留 现象 有 关 。 虽 然 每 张 胶片 图 11.2 走马 灯 图 例 
的 内 容 都 是 固定 不 变 的 ， 但 人 在 
观察 画 或 物体 后 ， 在 0.1~0.4 秒 内 不 会 消失 。 于 是 通过 30 帧 每 秒 的 连续 播 
放 ， 视 觉 暂 留 现象 会 让 人 对 电影 的 内 容 产 生 了 动 景 运动 的 错觉 ， 形 成 连续 
性 变化 的 感知 。 据 说 ， 人 在 被 谋杀 后 ， 眼 睛 瞳孔 会 留 下 邮 手 的 影子 。 日 本 
某 公司 还 基于 这 一 假设 对 监控 录像 中 的 人 眼 瞳 孔 图 像 进行 放大 、 锐 化 处 理 ， 
以 提取 受害 人 或 路 人 看 到 的 画面 ， 并 从 中 提取 犯罪 嫌疑 人 的 形象 或 车 牌号 
码 等 信息 。 

除了 动 景 运 动 的 错觉 ， 人 在 注视 目标 过 久 时 ， 会 因为 机 体 无 法 长 期 保 
寺 同 一 姿态 而 产生 不 由 自主 的 运动 ， 尤 其 是 眼球 的 细微 运动 。 而 这 种 运动 
会 被 反映 到 视网膜 上 ， 让 视觉 中 枢 错 以 为 是 目标 在 运动 ， 称 为 自主 运动 。 
比如 在 黑暗 的 密室 玩 恺 怖 解 谜 游戏 的 时 候 ， 长 时 间 盯 着 某 个 带 亮 光 的 物体 
时 (如 晴 旭 的 烛光 )， 有 可 能 就 会 产生 物体 在 移动 的 错觉。 因而 ， 无 形 中 增 
加 了 游戏 的 恕 悍 感 。 当 然 ， 要 解决 这 一 恐惧 的 关键 也 很 简单 ， 换 下 关注 的 
目标 或 增加 参照 物 即 可 。 

既然 生活 在 物理 世界 ， 人 的 视觉 也 会 受 运动 的 相对 性 影响 ， 形 成 诱导 
运动 。 比 如 停 在 车 站 的 两 辆 高 铁 , 人 坐 在 其 中 一 辆 里 , 明明 自己 的 车 开动 了 ， 
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却 会 以 为 是 对 面 的 另 一 辆 仍 停 着 的 车 开动 了 。 这 种 相对 性 是 受 周 边 环境 的 
运动 诱导 而 形成 的 。 如 果 焦点 随和 运动 的 物体 同步 变化 ， 另 一 个 静止 的 就 会 
被 误 以 为 在 运动 。 中 国 古 代 的 
禅宗 六 祖 慧 能 的 故事 中 ， 更 是 
把 对 这 一 现象 的 理解 做 了 升华 
(图 11.3 ) : 

一 天 ， 风 扬 起 寺庙 的 旗 
赋 ， 两 个 和 尚 在 争论 到 底 是 
“Pah” Be “A”? 慧 能 说 : 
“ 既 非 风 动 ， 亦 非 情 动 ， 仁 者 
SBF” 

另外 ， 当 目标 进行 高 速 运动 时 ， 人 的 视觉 会 对 运动 的 状态 产生 错误 判 
断 ， 即 形成 运动 停滞 甚至 反 转 的 运动 后 效 错 觉 。 如 观察 飞行 中 直升机 的 旋 
翼 ， 会 感觉 每 片 叶 子 都 能 看 清楚 ， 且 在 慢 慢 地 反 向 转动 。 现 在 有 些 做 机 器 
制图 的 机 器 臂 ， 高 速 运动 状态 时 也 能 达到 类 似 的 效果 。 

不 仅 会 出 现 运 动 后 效 ， 人 的 视觉 或 感知 系统 有 时 候 还 能 主导 运动 
的 方向 。 最 近 网 上 流行 的 一 个 旋转 舞 者 的 雕像 动 图 就 是 这 样 的 例子 ， 如 
图 11.49。 稍 做 学 习 ， 你 就 能 做 到 任意 控制 其 旋转 的 方向 。 这 种 循环 错觉 应 
该 是 来 源 于 选择 关注 点 前 后 次 序 的 策略 C85 p]: 盯 不 同 脚 会 产生 不 同 的 旋 
转 方 向 )， 也 可 以 理解 成 主观 时 间 先 后 顺序 选择 的 结果 。 

除了 这 些 错误 外 ， 当 对 具有 特殊 结构 的 运动 目标 进行 遮挡 时 ， 会 形成 
遮挡 错觉 ， 导 致 对 运动 目标 的 整体 结构 或 方向 产生 错误 判断 。 值 得 指出 的 
是 ， 这 种 一 叶 障 目的 错觉 不 止 是 视觉 上 会 出 现 ， 在 人 工 智 能 的 很 多 应 用 中 
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QD 旋转 舞 者 的 动 图 链接 : https//en.wikipedia.org/wiki/Spinning Dancer 
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都 可 能 碰 到 。 比 如 现在 流行 的 智能 城市 的 交通 控制 ， 如 果 只 对 一 个 路 口 进 
行 交 通 流量 优化 ， 很 有 可 能 当前 路 口 的 通畅 会 导致 更 大 范围 的 拥堵 。 


g r r 


图 11.4 旋转 王者 (spinning dancer) 动 图 中 的 4 帧 


还 有 一 个 比较 有 意思 的 错觉 ， 是 关注 点 集中 时 产生 的 光 流 错觉 。 飞 行 
员 在 驾驶 飞机 降落 时 ， 需 要 寻找 着 陆 跑道 。 当 其 以 着 陆 点 为 焦点 来 调整 飞 
机 航向 时 ， 着 陆 点 会 静止 不 动 ， 而 周围 环境 则 会 产生 长 度 不 一 但 有 规律 的 
光影 。 就 像 拍 运动 照片 时 ， 镜 头 跟随 跑步 中 的 运动 员 同 步 拍摄 时 ， 运 动员 
会 保持 清晰 成 像 ， 而 周围 影像 产生 同方 向 的 光影 一 样 。 这 种 光 流 错觉 可 以 
帮助 飞行 员 准确 确定 飞机 的 着 陆 位 置 。 

当然 ， 可 列举 的 运动 错觉 还 有 很 多 ， 如 图 11.5 中 扭曲 的 圆 点 阵列 ， 基 
于 边缘 错觉 观测 到 的 周边 漂移 错觉 ( peripheral drift illusion，PDI )， 据 说 能 
测试 人 的 精神 状态 的 “旋转 ”的 圆 盘 等 ， 就 不 一 一 枚 举 了 。 但 不 管 是 哪 种 ， 
错觉 都 与 人 视觉 中 枢 理解 的 “时 间 和 空间 ”与 客观 的 “时 间 和 空间 ”存在 
错位 有 密切 关系 ， 也 与 每 个 人 先前 习 得 的 经 验 有 关 。 在 多 数 情况 下 ， 大 脑 
对 信息 的 加 工 处 理 都 是 合理 、 有 效 的 ， 但 在 输入 信息 出 现 特殊 结构 ， 则 可 
能 出 现 反 常 感知 或 被 误导 ， 形 成 运动 错觉 。 
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图 11.5 错觉 图 示例 


那么 ， 这 些 错觉 有 没有 可 能 被 机 器 学 习 有 效 分 类 了 ? 如 果 能 做 到 ， 也 
许 对 人 工 智能 和 机 器 视觉 模仿 和 理解 人 的 视觉 处 理 能 力 会 有 巨大 的 帮助 。 
2018 年 10 月 , 位 于 美国 肯塔基 的 路 易 斯 维尔 (Louisville ) 大 学 的 罗伯特 : 威 
HE (Robert Williams ) 49 && - 亚 姆 波 尔 斯 基 (Roman Yampolskiy ) 报告 了 
他 们 的 尝试 结果 外。 他 们 构造 了 一 个 超过 6000 张 光学 错觉 图 像 的 数据 集 ， 
期 望 通过 深度 网 络 来 实现 有 效 分 类 和 生成 一 些 有 意思 的 视觉 错觉 图 。 不 过 
很 遗憾 ， 在 显卡 Nvidia Tesla K80 训练 了 7 小 时 的 实验 并 没有 带 来 任何 有 
价值 的 信息 。 尽 管 深度 学 习 要 求 的 硬件 算 力 已 经 没有 问题 了 ， 但 对 这 个 任 
务 的 学 习性 能 远 不 如 现在 的 上 千 万 级 数据 规模 的 人 脸 识别 和 图 像 检 索 理想 。 
他 们 推测 ， 一 个 可 能 的 原因 是 能 找到 的 光学 幻觉 /错觉 照片 少 ， 如 果 再 细 
分 类 别 就 更 少 了 ， 在 小 样本 意义 下 的 深度 学 习 可 能 不 是 太 有 效 。 另 一 个 可 
能 的 原因 是 现 有 的 机 器 还 不 能 完全 理解 为 什么 会 有 这 些 错 觉 ， 因 此 要 通过 
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如 生成 对 抗 网 生成 新 的 光学 幻觉 /错觉 也 很 难 。 这 也 许 是 机 器 视觉 还 不 能 
征服 的 人 类 视觉 的 堡垒 之 一 中。 

时 空 / 时 频 不 确定 性 

时 空 的 主观 感受 可 以 引起 各 种 感知 上 的 错觉 。 事 实 上 ， 不论 是 客观 还 
是 主观 ， 时 空 之 间 都 存在 某 种 关联 ， 而 对 这 一 关联 性 的 极致 解释 是 海 森 堡 
于 1927 年 提出 的 不 确定 性 原理 (uncertainty principle ) ( 也 称 测 不 准 原理 )。 
粗略 来 讲 ， 即 粒子 的 位 置 与 动量 不 可 同时 被 确定 。 前 者 与 空间 有 关 ， 后 者 
与 时 间 有 关 。 在 这 两 个 不 同 域 里 ， 一 个 域 的 参数 越 确定 ， 另 一 个 域 的 参数 
不 确定 的 程度 就 越 大 。 

巧合 的 是 ， 在 人 工 智能 领域 ， 有 3 个 重要 的 理论 也 能 看 到 这 种 不 确定 
性 的 影子 。 
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在 1807 年 的 数学 家 傅 里 叶 。 他 提 

出 了 一 个 当时 菲 夷 所 思 的 概念 ， 

即 任何 连续 周期 信号 可 以 由 一 组 

适当 的 正弦 ( BD — f: E) 曲线 

组 合 而 成 ， 称 为 傅 里 叶 变 换 ， 如 

图 11.6 所 示 。 这 个 时 频 变换 的 理 

ib, XN ICE THU RE MR n 

不 亚 于 对 欧 几 里 得 第 五 公设 的 推 

翻 。 不 过 ， 后 来 逐渐 揭示 的 事实 

让 大 家 都 明白 了 ， 这 种 加 权 组 合 

的 傅 里 叶 变 换 是 合理 的 。 该 论文 图 11.6 傅 里 叶 变换 : 任何 连续 周期 信号 

LO ae (如 最 下 方 的 曲线 ) 可 以 由 一 
RIT, MASKE 1822 适当 的 正 纺 ( 即 三 角 函 数 ) 曲线 

年 发 表 的 《 热 的 解析 理论 》 中 。 (上 方 的 4 条 曲线 ) 组 合 而 成 中 
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在 傅 里 叶 变 换 中 ,不同 周期 的 三 角 函 数 可 以 视 为 在 频 域 空间 的 基 函 数 ， 就 
像 三 维 空间 中 的 长 、 宽 、 高 一 样 。 通 过 传 里 叶 变换 后 ， 样 本 在 时 间 中 的 描 
述 就 转变 成 频率 空间 不 同 频率 分 量 的 幅度 大 小 。 

尽管 傅 里 叶 变 换 在 两 百年 前 已 被 提出 ,但 真正 用 于 人 工 智能 相关 领域 
还 是 在 数字 语音 、 数 字 图 像 出 现 以 后 。 科 学 家 们 发 现 了 很 多 在 原来 的 时 间 / 
空间 域 下 不 能 很 好 解决 的 问题 ， 比 如 周期 噪声 的 去 噪 、 图 像 / 视频 压缩 等 ， 
通过 傅 里 叶 变 换 转 到 频 域 空间 后 ， 却 能 轻松 处 理 和 实现 性 能 的 有 效 提升 。 

后 来 ， 科 学 家 们 又 发 现 只 将 空间 或 时 间 域 信号 转换 至 频 域 空间 ， 而 不 
去 深究 频率 的 高 度 和 宽度 似乎 有 些 粗 糙 ， 于 是 又 对 频率 域 引 入 了 多 尺度 的 
变化 , 便 有 了 小 波 变换 这 一 理论 体系 。 直观 来 说 , 小 波 变换 在 频率 的 取 值 上 ， 
就 像 音 乐 中 的 五 线 谱 ， 有 些 频 率 可 以 取 二 分 音符 ， 有些 能 取 四 分 音符 ， 有 
些 能 取 十 六 分 音符 ， 如 此 这 般 ， 而 传 里 叶 变换 只 是 简单 地 给 定 了 音调 ， 却 
把 所 有 音调 的 长 度 都 设 为 固定 不 变 。 小 波 变 换 这 种 多 尺度 的 技术 用 于 刻画 
自然 图 像 或 其 他 数据 时 ， 较 传 里 叶 变 换 有 了 更 精细 的 频率 表达 ， 这 一 技术 
也 被 用 于 构成 了 JPEG 2000 的 图 像 压 缩 标准 。 

在 传 里 叶 变换 和 小 波 变换 的 发 展 中 ， 科 学 家 们 也 发 现 了 一 个 现象 ， 原 
时 间 /空间 域 的 信号 间隔 越 宽 时 ， 对 应 的 频率 域 信号 间隔 会 越 稠 密 ， 反 之 
亦 然 。 两 者 呈现 类 似 于 海 森 堡 不 确定 性 原理 的 对 立 ， 如 图 11.7 所 示 。 

从 图 11.7 可 以 看 出 时 间 和 频率 之 间 的 平衡 。 图 像 上 的 每 个 像素 点 在 吸 
收 全 部 频率 在 给 定时 间 上 获得 的 值 ; 傅 里 叶 变 换 是 在 给 定 频率 ， 将 全 部 时 
间 的 值 累积 的 结果 ; 而 小 波 则 反映 了 两 者 的 折 中 ， 时 间 窗 口 宽 ， 则 频率 罕 ， 
反之 亦 然 。 
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图 11.7 海 森 堡 不 确定 原理 在 傅 里 叶 变 换 、 小 波 分 析 中 的 体现 四 
A: 图 像 的 时 频 (time vs frequency) 特性 ; P: 傅 里 叶 变换 的 时 频 特 性 ; 右 : 
小 波 分 析 的 时 频 特 性 


基于 这 个 观察 ， 科 学 家 们 推测 如 果 要 提高 人 工 智 能 很 关心 的 可 解释 性 ， 
最 直观 的 策略 是 将 原 空间 的 数据 变换 至 一 个 能 让 特征 数量 变 得 极其 稀 玻 的 
空间 。 但 天 下 没有 免费 的 午餐 ， 有 稀疏 必然 意味 着 在 某 个 地 方 付 出 稠密 的 
代价 。 这 就 是 在 2000 年 左右 提出 的 压缩 传 感 (compressive sensing ) 或 稀 
玻 学 习 理 论 的 主要 思想 。 值 得 一 提 的 是 ， 完 善 压缩 传 感 理论 的 贡献 人 之 一 
是 据说 智商 高 达 160、 拿 过 菲 尔 效 奖 的 华裔 数学 家 陶 哲 轩 。 该 理论 最 有 意 
思 的 一 点 就 是 把 基 苑 数 变 成 了 一 个 如 高 斯 分 布 形 成 的 随机 噪声 矩阵 ， 在 这 
个 矩阵 里 ， 每 个 点 的 分 布 是 随机 、 无 规律 的 ， 因 而 可 以 视 为 稠密 的 。 通 过 
这 样 的 处 理 ， 一 大 批 压 缩 传 感 或 稀 玻 学 习 方 法 被 提出 ， 并 获得 了 不 错 的 稀 
Wii ft o 
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时 间 换 空间 、 两 者 不 可 能 同时 完美 的 影子 。 这 种 情况 可 以 视 为 人 工 智 能 领 
域 在 时 空 /时 频 意义 下 的 “ 海 森 堡 (Heisenberg ) 不 确定 原理 ”。 

最 近 十 年 的 人 工 智 能 研究 非常 关心 预测 性 能 的 提升 ， 但 也 和 希望 能 获 
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得 好 的 可 解释 性 ， 如 通过 深度 网 络 获得 相应 任务 的 学 习 表 示 ( learning 
representation )。 这 也 是 2013 年 创办 的 深度 学 习 主 流 会 议 ， 把 会 议 名 
字 约 定 为 “国际 学 习 表 示 会 议 ”(Intermational Conference on Learning 
Representation，ICLR )， 而 非 深度 学 习 会 议 的 初衷 之 一 。 

但 是 否 能 学 到 有 效 的 学 习 表 示 ， 能 否 从 运动 错觉 中 找到 可 能 的 线索 或 
答案 ， 能 和 否 在 类 似 于 海 森 堡 不 确定 原理 的 框架 下 发 展 新 的 理论 算法 、 发 现 
智能 体 的 秘密 ， 是 值得 思考 的 。 
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=@ 听觉 错觉 与 语音 、 歌 唱 的 智能 分 析 


京 中 有 善 口 技 者 。 会 宾客 大 宴 ， 于 厅 事 之 东北 角 ， 施 八 
尺 屏 障 ， 口 技 人 坐 屏 障 中 ， 一 桌 、 一 椅 、 一 扇 、 一 抚 尺 而 已 。 
KRAE, VA, 但 闻 屏 障 中 抚 尺 一 下 , ERR, LHS, 

MRAP RR, AAR, HAI, Bei 
儿 醒 ， 大 啼 。 夫 亦 醒 。 妇 抚 儿 乳 ， 儿 含 乳 啼 ， 妇 拍 而 鸣 之 。 又 
KILE, RRA, HUH, FAIL A, Bp we, IL 
含 乳 啼 声 ， 大 儿 初 醒 声 ， 夫 叱 大 儿 声 ， 一 时 齐 发 ， 众 妙 毕 备 。 
满 坐 宾客 无 不 伸 颈 ， 侧 目 ， 微 笑 ， 默 叹 ， 以 为 妙 绝 。 


AIL, KHER, 妇 拍 儿 亦 渐 拍 渐 止 。 微 闻 有 和 鼠 作 作 索 索 ， 
金 器 倾 侧 ， 妇 梦 中 咳嗽 。 宾 客 意 少 舒 ， 稍 稍 正 坐 。 


忽 一 人 大 呼 “ 火 起 "”， 夫 起 大 呼 ， 妇 亦 起 大 呼 。 两 儿 齐 惨 。 
RETAK, BPL, BERR, PHARES, 
KRE, PIRE, BERE; 又 夹 百 千 求 救 声 ， 彼 屋 许 许 声 ， 
d&4 P 小 水 声 。 凡 所 应 有 , 无 所 不 有 。 虽 人 有 百 手 , 手 有 百 指 ， 
不 能 指 其 一 端 ; 人 有 百 口 ， 口 有 百 舌 ， 不 能 名 其 一 处 也 。 于 是 
宾客 无 不 变色 离 席 ， 奋 袖 出 辟 ， 两 股 战 战 ， 几 和 欲 先 走 。 


忽然 抚 尺 一 下 ,和 群 响 毕 绝 。 撤 屏 视 之 ， 一人、 一 桌 、 一 椅 、 
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一 扇 、 一 抚 尺 而 已 。 


以 上 段落 节选 自 《 广 初 新 志 》 的 《口技 》 dX Cit ) (图 12.1) 


图 12.1 口技 


声音 能 刻画 得 如 此 妙 不 可 言 ， 听 觉 系 统 功 不 可 没 。 就 人 而 言 ， 听 觉 系 
统 由 左右 两 只 耳 打 构成， 一 方面 能 帮助 我 们 形成 立体 听觉 ,方便 辨识 声音 
的 位 置 ， 另 一 方面 也 便于 我 们 在 不 喜 听 到 某 事 时 ， 可 以 一 只 耳 打 进 ,一 
耳 休 出 。 除 了 视觉 以 外 ， 它 也 是 男 一 个 可 以 帮助 我 们 实现 远 距离 以 及 视觉 
系统 不 可 用 时 识别 目标 的 感知 系统 。 比 如 《红楼 梦 》 中 描绘 的 “未 见 其 人 
先 闻 其 声 " ， 便 是 林 袋 玉 进 贾 府 初 见 王 钻 风 的 情形 ， 上 朗朗 的 笑 声 瞬 间 就 把 王 
申 凤 的 形象 树立 了 起 来 。 另 外 ， 因 为 人 的 视觉 接受 外 界 信 号 是 以 光 的 速度 
完成 的 ， 而 接收 声音 的 速度 则 慢 得 多 。 所 以 ， 听 觉 系 统 还 能 帮助 纠正 视觉 
上 的 错觉 。 比 如 ， 有 些 人 看 上 去 非常 的 闪 亮 、 聪 明 ， 这 一 印象 会 一 直 维 持 
到 听 到 他 开口 说 话 为 止 。 于 是 ， 为 了 保证 视觉 与 听觉 美感 上 的 “一 致 ， 不 
少 短视 频 APP 提供 了 大 量 有 特色 的 原声 。 这 也 是 短视 频 大 受 欢 迎 的 原因 之 
一 。 因 为 对 人 类 文明 而 言 ， 听 觉 系 统 促进 了 智能 体 之 间 的 交流 并 提升 了 精 
神 生活 的 档次 。 


并 


y 


HESS ETE 


要 更 具体 地 了 解 听觉 系统 ， 可 参考 图 12.2。 它 包括 用 于 收集 声音 的 耳 
廓 、 用 于 声音 传递 的 外 耳 道 、 用 于 将 声音 变 为 振动 频率 的 耳膜 、 耳 蜗 内 用 
于 将 声音 转 为 电 脉冲 的 毛细 胞 以 及 传输 电 脉冲 的 听 神 经 和 处 理 声音 的 听觉 
中 枢 。 其 中 毛细 胞 是 听觉 细胞 , 包括 3500 个 内 毛细 胞 和 12 000 个 外 毛细 胞 ， 
以 分 别处 理 不 同 频率 的 声音 。 另 外 ， 负 责 低 音 部 的 毛细 胞 数量 多 ， 而 负责 
高 音 部 的 相对 较 少 。 所 以 ， 对 年 纪 大 的 人 来 说 ， 首 当 其 冲 损失 的 是 高 音 或 
高 频 部 分 的 听力 能 力 。 


圆 窗 


耳 咽 管 


图 12.2 人 类 耳 采 的 解剖 构造 (为 了 视觉 的 效果 ， 图 中 的 耳 道 尺寸 被 夸大 ) 


虽然 人 的 听觉 系统 中 的 毛细 胞 数量 和 布局 ， 与 人 的 视网膜 有 一 比 。 但 
由 于 现 有 传感器 设备 的 限制 , 机 器 在 模仿 时 都 将 采集 到 的 声音 最 终 简 化 成 
一 条 曲线 似 的 信号 。 由 于 音频 信息 相对 简单 ， 所 以 ， 多 媒体 研究 最 开始 着 
手 的 方向 ， 就 是 数字 音频 处 理 。 随 着 计算 机 处 理 能 力 的 增强 ， 才 逐渐 将 研 
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究 重 点 转移 到 具有 二 维 结构 的 数字 图 像 上 来 。 在 1995 年 至 21 世纪 初期 ， 
曾经 有 一 段 时 间 ， 计 算 机 学 科 中 一 大 半 的 研究 生 从 事 的 研究 方向 都 与 数字 
图 像 处 理 密切 相关 。 说 不 定 ， 未 来 等 量子 计算 机 研制 成 功 ， 基 本 的 计算 基 
元 从 二 进 制 转 成 连续 值 后 ， 也 许 得 考虑 学 习 量子 语音 处 理 、 量 子 图 像 处 理 
的 理论 和 算法 知识 了 。 

撤 开 这 段 历史 不 表 ， 因 为 声音 是 多 源 的 、 随 时 间 变 化 的 ， 当 声音 压缩 
变 成 一 维 的 语音 信号 后 ， 语 音 处 理 的 难度 便 大 了 不 少 。 早期 的 语音 处 理 研 
究 是 举步维艰 的 。 曾 记得 1995 年 左右 的 微软 曾 出 过 一 版 语音 识别 软件 ， 识 
别 的 性 能 远 低 于 期 望 ， 很 快 就 被 市 场 淡忘 。 当 年 在 连续 语音 识别 的 主要 方 
法 ,包括 统计 学 领域 20 世纪 60 年 代 、 后 在 70 年 代 中 期 被 挪 到 语音 领域 的 
隐 马 尔 可 夫 模 型 ， 以 及 多 个 高 斯 分 布 组 合 的 多 元 混合 高 斯 模型 。 其 中 ， 隐 
马尔 可 夫 模 型 假定 了 声音 时 间 序 列 的 前 后 时 刻 具 有 相关 性 ， 即 马尔 可 夫 过 
程 。 同时, 假定 这 些 相关 性 由 一 组 隐 含 的 变量 控制 。 将 这 些 性 质 构成 网 络 后 ， 
便 形 成 了 隐 马 尔 可 夫 模 型 。 尽 管 模型 结构 有 细微 变化 ， 但 主要 思想 依旧 ， 
曾 在 语音 分 析 领 域 引领 风骚 数 十 年 。 一 直到 近年 来 深度 学 习 的 出 现 ， 语 音 
识别 也 由 于 预测 性 能 的 显著 提高 而 随 之 走向 全 面 实用 化 。 

但 实用 化 并 不 意味 着 听觉 系统 就 完全 被 了 解 清楚 了 ， 里 面 仍 有 许多 不 
明 的 机 制 ， 如 听觉 错觉 。 同 时 ,语音 识别 本 身 也 还 存在 一 些 目 前 难以 解决 
的 问题 。 不 仅 如 此 ， 人 类 在 说 话 以 外 ， 还 发 展 了 音乐 这 样 独一无二 的 能 力 ， 
尤其 是 唱歌 。 理 解 唱歌 ， 对 于 理解 智能 体 本 身 也 是 有 帮助 的 。 本 节 中 ,我 
将 从 此 三 方面 展开 介绍 。 


听觉 错觉 

听觉 系统 和 视觉 系统 一 样 ， 虽 然 有 效 ， 但 同样 存在 不 少 有 意思 的 错觉。 
这 些 错觉 既 有 来 自 听 觉 系统 的 ， 也 有 来 自 大 脑 生 理 或 心理 感受 的 ， 还 有 来 
自 外 部 经 过 特殊 设计 诱导 的 。 
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来 自 听 学 系统 的 通常 是 功能 性 退化 引起 的 。 举 例 来 说 ， 当 外 界 不 存在 
声 源 输入 ， 而 人 又 能 感受 到 声音 信息 时 ， 就 是 听觉 系统 本 身 出 了 问题 ， 可 
大 可 小 。 比 较 常 见 的 是 耳鸣 ， 一 些 神 经 官能 症 患 者 或 神经 衰弱 的 人 会 比较 
容易 出 现 这 种 问题 。 它 产生 的 原因 ， 一 直 众 说 纷 颖 ， 有 认为 是 大 脑 听 觉 中 
枢 存在 问题 所 致 ， 也 有 认为 与 传导 声音 的 神经 通道 在 无 信号 时 的 活动 有 关 。 
后 一 观点 里 ， 比 较 有 意思 的 一 个 研究 成 果 是 美国 约翰 ' 霍 普 金 斯 大 学 的 德 
怀特 : 彼 格 斯 等 2007 年 11 月 发 表 在 Nature (《 自 然 》) 上 的 外。 他 们 在 听 
力 还 没 发 育成 熟 的 小 鼠 上 进行 了 实验 ， 发 现 耳 鸣 的 发 生 可 能 与 听觉 系统 早 
期 阶段 非 感觉 性 毛细 胞 ， 即 支撑 细胞 有 直接 联系 。 他 们 认为 ， 在 听觉 系统 
未 成 熟 前 ， 这 些 支 撑 细 胞 会 本 能 释放 ATP ( 腺 苷 三 磷酸 ) 能 量 分 子 ， 形 成 
电信 号 输入 大 脑 。 这 些 电信 号 在 发 育 初期 听 起 来 就 像 是 噪声 ， 可 用 于 帮助 
听觉 系统 尽早 做 好 准备 。 从 某 种 意义 来 看 ， 这 种 准备 就 像 听觉 系统 的 自 检 ， 
与 人 晚上 睡觉 时 “偶尔 会 路 腿 来 检测 人 是 否 还 活着 ”一 个 道理 。 而 到 长 大 
以 后 ， 这 种 自 检 偶 尔 还 会 被 触发 。 频 率 发 生 过 高 的 则 有 可 能 形成 持续 性 耳 
鸣 的 疾病 。 所 以 ， 了 解 耳鸣 的 形成 机 制 也 许 有 助 于 理解 人 听觉 系统 的 早期 
发 育 。 

除了 这 种 耳鸣 外 ， 人 甚至 可 以 在 不 使 用 听觉 系统 时 ， 也 能 感受 到 声音 。 
比如 ， 你 沉思 的 时 候 ， 那 个 在 你 脑袋 里 说 话 的 声音 ， 是 谁 发 出 的 呢 ? 

男 一 种 错觉 是 人 对 声音 美感 的 感知 。 它 包括 说 话 声 和 唱歌 两 种 错觉 。 

在 日 常生 活 中 ,说 话 人 错觉 更 为 常见 。 人 们 总 是 对 自己 的 声音 比较 满 
意 ， 直 到 听 到 通过 录音 方式 播放 出 来 的 声音 后 ， 才 发 现 与 自己 以 为 听 到 的 
还 有 点 差距 ， 有 时 会 觉得 录音 机 里 播 出 来 的 声音 会 更 难听 一 些 。 其 原因 有 
Bit, 一 是 因为 人 在 听 自 己 声音 的 时 候 ， 声 音 是 通过 颅骨 传 至 内 耳 再 进入 
听觉 中 枢 的 。 而 其 他 人 听 到 的 声音 ， 与 录音 机 通过 空气 介质 传播 获得 的 相 
同 。 传 播 媒 介 不 同 ， 自 然 会 有 些 差异 。 另 一 个 原因 可 能 是 人 类 会 习惯 把 自 
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己 的 声音 标定 得 更 美好 一 些 。 在 2000 年 两 位 心理 学 家 邓 宁 (Dunning) 和 
克 鲁 格 (Kruger) 提出 的 、 获 得 了 《搞笑 诺 贝 尔 心 理学 奖 》 的 达 克 效 应 
( Dunning-Kruger effect) 可 以 部 分 解释 这 一 现象 。 简 单 来 说 ， 人 容易 沉浸 
在 自我 营造 的 虚幻 优势 之 中 ， 过 高 估计 自己 的 能 力 ， 属 于 一 种 认 知 偏差 。 
因此 ， 人 也 会 在 大 脑 中 自动 地 美化 自己 的 声音 。 

语音 识别 及 相关 应 用 

抛 去 错觉 不 提 ， 语 音 识别 本 身 有 许多 细 分 和 衍生 的 应 用 值得 研究 。 应 
用 面 很 宽 的 一 种 是 语音 转换 文字 ， 可 以 是 同一 语种 ， 也 可 以 是 跨 语 种 。 同 
语种 的 转换 ， 在 深度 学 习 出 来 后 ， 预 测 性 能 确实 有 了 一 个 质 的 飞跃 , 在 识 
别 性 能 和 用 于 语音 搜索 方面 都 已 经 不 是 20 世纪 90 年 代 可 比拟 的 了 。 不 过 ， 
现 阶段 的 水 平 也 并 非 完全 能 替代 其 他 输入 设备 ， 仍 存在 一 些 无 法 有 效 解 读 
的 场景 。 以 中 文 为 例 ， 汉 字 的 数量 超过 8 万 个 ， 常 用 的 约 3500 个 。 另 外 ， 
汉字 重音 字 特 别 多 ， 据 说 有 1600 多 个 。 两 个 数量 相 比 ， 便 可 以 知道 中 文 语 
音 转 换文 字 的 难度 有 多 高 。 极 端 情况 下 ， 可 以 参考 “中 国 现代 语言 学 之 父 ” 
赵 元 任 ( 1892 一 1982 ) HEGIZ Pr eg, Oil EC AME) ERE Y) A CE 
姬 击 鸡 记 》 其 中 一 首 于 1930 年 在 美国 写 的 《 施 氏 食 狮 史 》 如 下 : 

ie SIF LEK, BI, ZRH, MANNE PAI, TH, AF 
iP, ZH, CHRP, ARRATI, SAB, HAMM, KH 
是 十 狮 尸 ， 适 石室 。 石 室 湿 ， 氏 使 侍 拭 石 室 。 石 室 找 ， 氏 始 试 食 是 十 狮 尸 。 
食 时 ， 始 识 是 十 狮 尸 ， 实 十 石狮 己 。 试 释 是 事 。 

这 段 几 乎 完全 同音 的 文字 ， 机 器 目前 仍 很 难 根据 语音 将 其 转 成 有 效 文 
字 的 。 如 果 通 过 目前 正 流行 的 知识 图 谱 来 对 重音 字 进 行 辅助 解释 ， 也 许可 
以 部 分 解决 这 一 问题 。 这 对 于 打字 不 方便 的 人 来 说 ， 是 比较 好 的 选择 。 但 
对 于 熟悉 打字 的 ， 引 入 知识 图 谱 这 样 的 操作 会 浪费 大 量 不 必要 的 筛选 时 间 。 
尤其 像 上 例 这 种 情况 ， 知 识 图 谱 能 做 的 是 对 每 个 单字 都 进行 解释 ， 显 然 还 
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不 如 打字 来 得 快 。 

而 跨 语种 的 翻译 ， 国 内 外 都 在 做 ， 也 有 一 些小 型 配套 硬件 被 推出 ,但 
离 同 声 翻译 的 距离 还 很 远 ， 因 为 它 不 仅仅 是 语音 识别 的 问题 ， 还 涉及 更 复 
杂 的 自然 语言 处 理 ， 以 及 广泛 的 背景 知识 。 

语音 也 可 以 用 于 人 身份 的 识别 。 尽 管 不 如 识别 人 的 外 表 (如 人 脸 ) AB 
么 形象 直观 ,但 仍然 是 重要 的 生物 认证 方式 之 一 ， 在 反 电 话 诈骗 方面 也 有 
潜在 的 应 用 。 语 音 与 视频 结合 还 能 实现 计算 机 读 展 语 ， 这 一 技术 对 于 听力 
有 障碍 且 交 流 困 难 的 人 尤其 是 故 哑 人 将 有 所 帮助 。 

歌唱 识别 

人 类 听觉 系统 除了 用 于 交流 、 识 别 和 警示 外 ， 还 进化 了 一 种 可 能 只 有 
人 类 才 具 有 的 高 级 智能 ， 就 是 音乐 ， 如 独唱 合唱 、 乐 器 独奏 合奏 等 。 其 中 ， 
唱歌 是 最 容易 又 是 最 难 的 “乐器 "。 因 为 随便 谁 都 能 唱 ， 唱 得 好 是 “余音 绕 
梁 ， 三 日 不 绝 ”， 反 之 也 可 能 会 “ 呕 哑 哮 晰 难 为 听 ”。 与 语音 识别 相 比 ， 歌 
唱 的 分 析 有 更 多 的 困难 要 克服 ， 原 因 可 以 从 两 个 方面 来 解释 。 

(1 ) 与 说 话 的 区 别 

人 在 说 语 时 多 以 声带 振动 来 发 声 ， 音 调 、 频 率 都 在 人 最 自然 的 发 声 区 ， 
偶尔 有 些 人 会 用 腹 式 呼吸 来 增强 声音 的 厚度 和 减少 声带 的 疲劳 。 即 使 情绪 
波动 会 影响 发 声 ， 但 一 般 变 化 也 不 会 太 大 。 

而 唱歌 则 需要 比较 多 的 技巧 ， 有 着 与 说 话 显著 不 同 的 特点 。 第 一 ， 唱 
歌 的 音域 变化 范围 很 宽 。 比 如 俄罗斯 男 歌手 维 塔 斯 能 从 最 低音 到 最 高 音 唱 
跨 4 个 八 度 ， 最 高 的 声音 能 跟 开水 壶 烧 开 水 发 的 声音 一 样 高 ， 非 常 厉害 。 
ASFA, IRI ZEN PES, HEE 5 次 ， 一 口气 下 来 也 有 5 个 八 度 。 
第 二 ， 共 鸣 腔 的 运用 上 唱歌 和 讲话 的 区 别 也 非常 之 大 。 比 如 唱歌 时 用 的 头 
部 共鸣 ， 有 从 鼻腔 和 后 脑 勺 位 置 发 声 共鸣 的 区 别 ， 这 两 者 导致 的 音色 差别 
很 大 。 要 根据 歌曲 风格 不 同 来 取舍 ， 老 百姓 常 听 到 的 美声 唱法 喜欢 把 头 腔 
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共鸣 置 后 。 如 果 留 意 看 歌星 唱歌 ， 有 些 专业 歌手 唱 高 音 的 时 候 会 挤 眉 开眼 ， 
鼻子 皱 了 起 来 ， 那 其 实 就 是 在 找 高 音 共 鸣 的 位 置 。 为 了 歌曲 表达 的 厚度 ， 
光 靠 头 腔 还 不 够 ， 因 为 会 比较 单薄 ， 还 得 利用 胸腔 共鸣 加 强 中 低音 区 的 共 
鸣 。 如 果 想 把 音域 再 提高 ， 还 可 以 学 习 用 面罩 唱法 、 咽 音 和 关闭 唱法 来 发 
声 。 而 低音 比如 呼 麦 的 唱法 则 要 把 气 运 到 声带 附近 振动 发 声 。 第 三 ， 气 息 
也 是 造成 说 话 和 唱歌 区 别 变 大 的 地 方 。 歌 曲 中 有 些 歌 词 特别 长 ， 只 用 平时 
说 话 那 种 比较 浅 的 胸 式 呼吸 往往 很 难保 持 旋律 的 稳定 和 连续 性 ， 所 以 需要 
借助 胸 腹 式 呼 吸 以 及 更 复杂 的 换 气 技巧 。 第 四 ， 不 像 说 话 一 般 是 四 平 八 稳 
的 ， 歌 曲 的 节奏 变化 很 丰富 ， 一 首 歌 里 可 能 快慢 缓急 都 会 出 现 。 第 五 ， 对 
歌词 的 理解 和 情感 的 投入 也 会 使 唱歌 与 说 话 有 显著 的 差别 。 第 六 ， 连 读 问 
题 。 中 文 歌词 相对 好 一 些 ， 但 英文 在 唱歌 中 的 连 读 就 多 得 多 了 。 

关于 唱歌 和 说 话 ， 人 们 可 能 还 会 有 个 错觉 ， 以 为 口吃 的 人 唱歌 一 定 唱 
不 好 。 但 实际 上 这 两 者 属于 不 同 的 发 声 机 制 。 说 话 需要 思考 要 讲 的 内 容 ， 
并 进行 语言 组 织 ， 再 说 出 来 。 而 唱歌 通常 是 歌曲 的 语调 、 语 速 和 语气 都 已 
经 给 定 ， 人 需要 做 的 是 将 这 些 内 容 经 过 反复 练习 后 复述 即 可 。 所 以 ， 口 吃 
的 人 ， 可 以 试 着 通过 学 习 唱 歌 来 找到 流利 发 声 的 自信 。 

唱歌 和 说 话 的 这 些 区 别 ， 使 得 唱歌 中 的 语音 识别 变 得 尤其 困难 ， 但 因 
此 也 衍生 了 更 多 的 与 语音 和 智能 相关 的 应 用 。 

(2 ) 如 何 评价 歌曲 的 美 

唱歌 对 多 数 人 来 说 ， 是 缓解 心情 的 方式 之 一 。 听 到 喜欢 的 歌 ， 学 来 便 
唱 了 。 可 是 唱 得 好 不 好 呢 ? 很 多 人 并 不 太 清楚 ， 对 自己 的 歌声 也 比较 “ 自 
信 ”， 我 也 是 如 此 。 另 外 ， 什 么 样 的 歌 才 可 以 定义 为 好 听 的 歌曲 呢 ? 

音乐 里 面 定义 好 听 与 否 ， 有 个 与 频率 了 相关 的 通用 法 则 。 这 是 日 本 著 
名 物理 学 家 武者 利 光 于 1965 年 在 应 用 物理 学 会 杂志 发 表 的 文章 《生物 信息 
和 1/f 起 伏 》 中 提出 的 1/f 波 动 原则 。 波 动 或 起 伏 指 某 个 物理 量 在 宏观 平均 
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值 附近 的 随机 变化 ， 其 原则 在 很 多 领域 都 适用 。 就 音乐 来 说 ，1/ 了 表明 旋律 
在 局 部 可 以 呈现 无 序 状 态 ， 而 在 宏观 上 具有 某 种 相关 性 的 ， 可 以 让 人 感到 
舒适 和 谐 的 波动 。 如 邓丽君 的 《甜蜜 蜜 》《 小 城 故 事 》 等 就 是 符合 1/7 波动 
原则 的 曲子 ， 所 以 大 家 很 喜欢 听 。 但 这 一 理论 只 适用 解释 比较 舒缓 的 歌曲 。 
对 于 其 他 形式 的 音乐 风格 ， 如 摇滚 、 说 唱 等 ， 则 是 因为 其 蕴含 的 律动 能 帮 
助人 宣泄 和 抒发 心情 有 关 。 更 有 甚 者 ， 还 有 完全 背离 1/f 波 动 原则 的 歌曲 ， 
如 甲壳 虫 乐队 (The Beatles). 主唱 约翰 列 依 老婆 小 野 洋 子 (Yoko Ono ) 
在 纽约 的 现代 艺术 博物 馆 演 唱 的 、 几 乎 接近 噪声 的 实验 歌曲 Fireworks (KKA 
花 》) [ 原 唱 凯 蒂 : 佩 里 (Katy Perry ) ]。 

为 帮助 评估 音乐 是 否 好 听 ， 科 学 家 们 还 提出 了 一 些 心理 声学 的 定性 和 
定量 指标 ， 如 基于 粗糙 度 、 尖 锐 度 、 波 动 度 和 音调 等 声学 特征 组 合 构成 的 
“烦恼 度 ” 和 “感知 愉悦 度 ” 等 复合 声学 指标 。 但 不 管 如 何 约 定 ， 声音 的 感 
知 仍 是 以 个 体 的 主观 感受 为 评价 ， 公 众 认同 的 并 不 见得 能 用 于 刻画 小 众 的 
审美 观点 。 对 于 歌声 ， 有 人 喜欢 粗 儿 低沉 的 ， 有 人 喜欢 清澈 如 水 的 ， 有 人 
喜欢 喷 亮 的 ， 有 人 喜欢 委婉 的 ; 对 于 歌曲 ， 有 人 喜欢 稀奇 古怪 的 ， 有 人 嘉 
欢 平 铺 直 叙 ， 有 人 喜欢 口水 歌 ， 有 人 喜欢 阳春 白雪 。 音 乐风 格 的 多 样 性 和 
个 性 化 色彩 的 浓郁 ， 使 得 人 工 智能 很 难 真 正 地 形成 统一 的 客观 标准 来 百代 
这 一 领域 的 工作 。 

(3) 歌曲 /歌唱 的 相关 应 用 

虽然 歌曲 /歌唱 的 分 析 显 然 比 单纯 的 语音 识别 复杂 、 难 度 高 ， 但 在 人 
工 智 能 领域 还 是 有 一 些 相 关 的 应 用 。 这 里 列举 几 个 比较 有 应 用 价值 的 。 一 
是 歌曲 哼 唱 识别 ， 这 是 目前 多 数 提供 音乐 的 平台 有 或 者 正在 尝试 做 的 一 项 
功能 。 其 任务 是 要 根据 局 部 片段 的 旋律 ， 来 识别 可 能 的 曲子 。 难 点 在 于 ， 
并 非 每 个 人 都 能 准确 地 把 旋律 哼 出 来 。 多 数 采用 这 种 方式 找 曲 子 的 ， 原 因 
可 能 是 不 记得 歌 名 ， 或 者 只 是 一 段 遥远 的 旋律 记忆 。 其 次 ， 人 的 发 音频 率 、 
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音调 、 说 话 的 清晰 度 和 原 唱 都 有 一 定 的 差异 。 所 以 ， 哼 唱 识别 的 任务 是 要 
从 不 精确 的 哼 唱 中 找到 有 效 的 候选 集 。 

除了 哼 喝 ， 另 一 个 重要 的 应 用 是 自动 调 音 。 一 是 因为 很 少 有 人 能 具有 
绝对 音 高 的 能 力 ， 即 使 经 过 专业 训练 ， 仍 然 可 能 不 稳 。 二 是 多 数 人 的 音准 
和 稳定 性 是 存在 问题 的 。 而 喜爱 唱歌 的 人 又 多 。 所 以 ， 自 动 调 音 对 于 专业 
歌手 和 业余 爱好 者 都 有 很 大 的 应 用 市 场 。 但 由 于 音乐 的 风格 往往 千变万化 ， 
而 且 还 要 学 习 和 增强 每 个 人 特有 的 辨识 度 和 个 性 化 音色 ， 所 以 ， 利 用 人 工 
智能 技术 构造 自动 调 音 师 的 难度 显而易见 。 

另外 ， 音 乐 声 与 人 声 分 离 也 是 一 个 极其 重要 的 研究 方向 。 人 类 在 这 方 
面 的 能 力 非常 强 ， 可 以 在 非常 嗜 杂 的 环境 中 轻松 选择 自己 关注 的 声音 来 聆 
听 。1953 年 彻 瑞 〈Cherry ) 将 人 类 听觉 注意 引发 的 这 一 现象 称 为 鸡尾酒 会 
效应 ( cocktail party effect )。 虽 然 这 一 现象 已 经 发 现 近 半 个 多 世纪 ， 但 人 工 
智能 要 实现 和 人 相近 的 辨识 能 力 还 很 难 。 因 为 通过 话 简 获 取 的 音频 信号 一 
般 是 多 个 声 源 混合 而 成 的 一 维 的 音频 信号 ， 要 再 分 离 出 原来 的 多 个 信号 源 
将 是 一 对 多 的 病态 问题 , 没有 唯一 解 。 事 实 上 , 人 类 在 听取 录制 后 的 声音 后 ， 
也 无 法 获得 鸡尾酒 会 效应 的 能 力 了 。 

要 解决 这 一 难题 ， 在 人 工 智 能 领域 通常 会 假定 这 些 信息 源 是 相互 独 
立 的 ， 且 不 符合 之 前 提 过 的 高 斯 分 布 ， 输 出 结果 为 这 些 信息 源 的 加 权 组 
合 。 信 息 源 的 分 离 ， 又 称 为 盲 源 分 离 ( blind-source separation )。 早 先 的 做 
法 是 利用 机 器 学 习 和 模式 识别 领域 的 独立 分 量 分 析 ( independent component 
analysis ) 的 技术 或 其 改进 版 来 实现 ， 但 这 一 方法 的 不 足 是 收敛 速度 慢 ， 
且 难 以 获得 唯一 解 。 最 近 深 度 学 习 在 这 一 方向 上 也 有 了 长 足 的 进步 。 如 
“谷歌 研究 ”2018 年 8 月 在 图 形 学 顶级 期 刊 《计算 机 图 形 学 会 刊 》( 4CM 
Transactions on Graphics, ACM ToG) 上 公布 的 最 新 成 果 。 作 者 埃 弗 拉 特 
( Ephrat ) 等 将 音 视频 结合 起 来 ,分 别 对 视频 和 音频 采用 两 个 深度 学 习 模 型 
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提取 各 自 特征 。 融 合 特征 后 ， 再 用 一 个 考虑 时 间 变 化 的 长 短 时 记忆 深度 模 
型 (long short-term memory，LSTM ) 来 刻画 音 视频 的 时 序 特性 ， 最 后 为 每 
个 说 话 者 都 采用 两 个 不 同 的 解码 系统 来 分 离 音 频 和 视频 。 该 模型 达到 了 目 
前 的 最 佳 效 果 ， 离 模拟 人 类 的 鸡尾酒 会 效应 又 进 了 一 步 。 但 其 仍 存在 一 些 
不 足 ， 主 要 有 两 点 。 一 是 需要 借助 视频 ， 所 以 ， 人 脸 必 须 出 现在 画面 里 帮 
助 定位 声音 源 ， 这 与 人 在 鸡尾酒 会 上 并 不 需要 视觉 的 帮助 来 定位 相 比 还 是 
要 弱 不 少 。 二 是 ， 该 研究 还 没有 涉及 歌声 和 乐器 声 分 离 这 一 类 更 难 的 问题 
(图 12.3 )。 


图 12.3 给 入 的 视频 帧 与 音频 (a); 处 理 思路 : 分 别提 取 视 频 、 音 频 特 征 ， 并 执 
行 音 视频 源 分 离 (b); 为 每 个 说 话 者 输出 干净 的 音频 (Ce) P7 


当然 ， 基 于 人 工 智能 的 音乐 分 析 还 有 很 多 其 他 有 意思 的 应 用 ， 如 计算 
机 作曲 / 写 歌词 、 设 计 像 洛 天 依 一 样 的 唱歌 机 器 人 等 。 但 总 体 来 看 ， 人 类 
作者 写 出 的 歌词 、 旋 律 的 意境 往往 具有 更 好 的 整体 性 和 更 强 的 逻辑 性 ， 而 
计算 机 模拟 的 目前 还 只 能 做 到 局 部 逼近 ， 在 大 局 观 、 整 体 情 感 的 把 握 上 仍 
然 任重道远 ， 也 许 现 阶段 考虑 与 人 的 混合 智能 处 理 是 不 错 的 尝试 。 

那么 ， 音 乐 中 还 有 没有 其 他 比较 有 意思 的 错觉 呢 ? 下 回 书 表 ! 
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I 


视听 错觉 与 无 限 音阶 中 的 拓扑 


小 朋友 小 时 候 ， 我 们 请 了 一 位 家 里 外 婆 癸 分 的 亲戚 帮忙 

AMR, BRERA, PAA), RUB, RR 

在 湖南 省 的 华容 县 ， 那 边 的 人 管 这 个 暮 分 的 都 称 为 “家 (Ga) 

家 (Ga 六 ， 所 以 ， 叫 起 来 也 不 会 太 克 从 和 别扭 ， 反 正 外 人 听 

不 懂 。 小 朋友 学 语言 很 快 ， 一 切 都 很 正常 。 可 是 GaGa 老 是 叫 

不 好 ， 总 发 成 DaDa。 她 自己 也 没 觉得 有 什么 不 对 ， 我 们 纠正 

了 几 次 ， 没 什么 效果 ， 只 好 听 之 任 之 了 。 还 好 ， 随 着 小 朋友 

一 天 天 长 大 ， 终 于 有 一 天 她 自己 纠正 过 来 了 。 

上 一 篇 说 过 ， 人 在 辨 声 方面 有 “鸡尾酒 会 效应 ”的 能 力 。 一 个 人 不 需 
要 借助 视觉 的 帮助 就 可 以 在 酒会 中 选择 性 地 聆听 需要 听 的 声音 ， 而 把 其 他 
声音 弱化 甚至 屏 项 掉 。 谷 歌 则 尝试 结合 视频 与 语音 来 提高 人 声 分 离 的 性 能 。 
那么 ， 视 觉 与 听觉 之 间 会 不 会 相互 影响 呢 ? 

视听 错觉 

第 一 个 证 实 视觉 与 听觉 有 相互 影响 的 实验 来 源 于 一 次 意外 。 早 在 20 1 
纪 70 年 代 中 期 ， 英 国 萨 里 ( Surrey ) 大 学 的 心理 学 家 哈里 ， 麦 格 克 (Harry 
McGurk ) 和 他 的 助手 约翰 麦克 唐 纳 (John MacDonald ) 做 了 个 实验 。 他 
们 用 不 同 的 口语 因素 给 视频 配音 ， 想 研究 不 同时 期 儿童 对 语言 的 理解 程度 。 
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在 配音 的 时 候 ， 一 个 本 应 发 “ga” 的 音节 错 配 成 了 “ba” 的 音 , 测试 者 听 
完 后 坚持 认为 听 到 的 音节 是 第 三 节 音 素 “da"” 而 不 是 视频 中 说 出 来 的 原音 节 。 
对 于 这 个 意外 ， 他 们 分 析 后 认为 ， 在 听觉 系统 和 视觉 系统 收集 的 信息 存在 
相互 矛盾 时 ， 人 类 会 优先 相信 视觉 通道 传输 进来 的 信息 。 因 为 与 视觉 系统 
相 比 ， 听 觉 系统 获得 的 信息 没有 那么 强 的 确定 性 。 他 们 将 这 一 现象 称 “ 考 

格 克 效应 ”( McGurk effect ) 9。 该 成 果 发 表 在 1976 年 的 《自然 》 杂志 上 四 。 

随 着 研究 的 深入 ， 科 学 家 们 发 现 这 种 视听 觉 相互 影响 的 “ 麦 格 克 效应 ” 
在 很 多 方面 都 有 体现 。 比 如 ， 儿 童 在 早期 发 音 的 学 习 上 。 如 果 视 觉 和 听觉 
没有 得 到 好 的 整合 ， 儿 童 就 容易 产生 错误 的 发 音 。 另 外 ， 视 力 不 好 的 人 ， 
如 果 摘 下 眼镜 ,也 很 可 能 出 现 “ 麦 格 克 效应 ”， 会 感觉 自己 的 听力 也 同时 下 
降 了 。 

2007 4F, FT (Kórding) 等 进一步 研究 了 视听 觉 相互 影响 的 情况 。 
他 们 在 5 个 平行 的 位 置 上 均 放置 了 发 声 和 闪光 设备 ， 然 后 在 不 同 或 相同 的 
位 置 同时 给 出 声音 和 闪光 ， 让 19 位 测试 者 判断 发 声 的 位 置 和 闪光 的 位 置 。 
实验 设置 和 结果 如 图 13.1 所 示 四 。 

从 图 13.1 可 以 看 出 ， 当 光 和 声音 分 别处 理 、 没 有 相互 干扰 时 ，19 位 测 
试 者 的 反应 是 稳定 且 合 乎 正确 分 布 的 。 而 当 灯 光 和 声音 同时 出 现 后 ， 能 看 
出 : 闪光 位 置 的 判断 几乎 不 受 影响 ,与 没有 声音 的 时 候 分 布 一 致 ; QF 
的 位 置 影响 明显 。 尤 其 最 后 一 列 ， 其 声音 似乎 容易 被 光线 影响 ， 而 形成 轻 
微 向 左 的 误 判 。 这 表明 听觉 获得 声音 的 不 确定 更 多 一 些 ， 更 容易 被 视觉 感 
知 的 闪光 影响 。 所 以 ， 麦 格 克 效 应 和 视听 觉 的 实验 都 表明 ， 视 觉 确实 会 影 
Ws] re fr ART 


QD KHER MUMIA: https://v.qq.com/x/page/i0624sd97n4 html 
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刺激 
一 一 一 一 页 z 
# 省 x 
按 下 按钮 = 
视觉 cm Y i 0 Ss 
* e. -10 0 10 
听觉 EE | 音 感知 位 置 《度数 ) 
(a) (b) 
一 听觉 反应 uw 
m 听觉 模式 T ° y 
一 视觉 反应 
m 视觉 模式 Pe EF. ie 
无 音频 
Q---- \ X € JA 


ste A aA cA GA LA 
Cu dI dul ak. ul ut 


图 13. 视听 觉 线 索 的 组 合 Un 

(a) 实验 架构 。 每 个 测试 ， 同 时 给 出 一 个 视觉 和 一 个 听觉 刺激 ， 测 试 者 通过 
按 按钮 来 报告 感知 的 视觉 刺激 和 听觉 刺激 位 置 。 (b ) 显示 视觉 对 在 中 间 位 置 发 出 
的 听 党 刺激 的 感知 位 置 影响 。 不 同 颜色 对 应 在 不 同位 置 的 视觉 刺激 ( 颜色 从 暖色 调 
转 为 冷色 调 ) 。 只 有 声音 的 模型 以 灰色 表示 。(c ) 对 于 35 种 刺激 条 件 ， 测 试 者 ( 实 
R ) 以 及 理想 观测 者 的 预测 ( 玻 折线 ) 的 平均 响应 ,左边 第 一 列 虚 线 为 5 个 闪光 位 置 ; 
第 二 列 为 无 音频 的 响应 ， 从 左 至 右 的 折线 表示 响应 位 置 。 在 无 音频 时 响应 很 精确 。 
上 方 第 一 行 指 5 个 声音 位 置 ; 第 二 行为 无 视频 响应 ， 从 左 到 右 的 折线 表示 响应 情况 
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无 限 音阶 的 拓扑 


听觉 反 过 来 会 促进 视觉 上 的 感知 。 我 们 在 观赏 影视 作品 时 经 常 能 感 

到 。 比 如 在 家 看 恐怖 电影 时 ， 一 到 令 人 惊悚 的 情节 ， 胆 小 者 就 会 情不自禁 
音量 关 小 或 干脆 关闭 音响 ,说明 视 听觉 的 双重 作用 确实 增强 了 影片 的 恐 
怖 程度 。 

另外 , 在 音乐 中 ,还 有 个 奇怪 的 旋律 。 通 过 两 个 或 多 个 声 部 的 交替 ， 
能 产生 无 穷 递 进 的 感觉 ， 让 人 误 以 为 声音 一 直 在 往 高 处 走 。 这 就 是 谢 帕 德 
音阶 ( Shepard tone )， 也 称 为 无 限 音阶 。 

相 比 音乐 的 历史 ， 这 种 音阶 出 现 的 时 间 比 较 晚 。 它 是 美国 斯 坦 福 大 学 
的 心理 学 家 谢 帕 德 在 1971 年 的 心理 学 实验 中 发 明 的 ， 故 称 为 谢 帕 德 音 阶 。 
它 由 不 重合 的 多 个 八 度 音 组 合 在 一 起 ， 形 成 多 个 声 部 。 据 说 2017 年 克 里 
斯 托 弗 ， 诺 兰 执 导 有 关 “ 二 战 ” 历 史 事件 “ 敦 刻 尔 克 大 撤退 ”的 电影 《 敦 
刻 尔 克 》 时 ， 为 了 能 给 海边 撤退 的 场景 营造 一 种 无 始 无 终 的 紧张 感 ， 便 送 
给 作曲 家 汉 斯 * 季 默 一 个 手表 连续 敲 击 的 录音 。 季 默 受 此 启发 ， 便 以 与 之 
类 似 的 谢 帕 德 音 阶 为 基础 ， 创 作 了 电影 的 背景 乐 。 事 实证 明 ， 这 段 配乐 

常 完美 地 加 强 了 撤退 时 的 紧张 感 ， 让 观众 有 了 身 临 其 境 、 坐 立 不 安 的 
eit ©. 

为 了 帮助 理解 ， 我 用 一 个 类 似 的 两 声 部 例子 来 解释 谢 帕 德 音阶 的 构成 ， 
如 图 13.2 所 示 。 其 中 ， 第 一 列 的 低音 部 分 是 慢 慢 渐 强 ， 而 第 二 列 的 高 音 
分 则 慢 慢 减 弱 ， 到 最 弱 音 时 ， 再 同时 增加 一 个 相同 音量 但 低 八 度 的 音 进 来 。 
按 此 规律 ， 两 列 的 旋律 一 直 循 环 播放 。 结 果 ， 在 第 一 列 的 低音 到 最 强 处 ， 
A ESE E 于 是 两 个 声 部 就 实现 了 自然 的 过 渡 ， 低 
声 部 过 渡 到 高 声 部 ， 高 声 部 也 过 渡 到 低 声 部 。 如 果 按 此 规律 增加 更 多 的 声 


党 


C 谢 帕 德 音阶 在 《 敦 刻 尔 克 》 中 的 视频 链接 : https:/v.qq.com/x/page/g05479i6hs5.html 
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部 进来 ， 那么， 旋律 中 总 可 以 一 直 听 到 至 少 两 种 声调 在 同时 升 高 。 而 大 脑 
会 形成 听觉 错觉 ， 认 为 这 些 音调 一 直 在 往 上 走 。 


C4 (人 小声 ) C5 (KË) 一 相差 八 度 差 
CH4 ( 渐 强 ) CHS ( 渐 弱 ) 

D4 D5 

D#4 D#5 

E4 E5 

F4 F5 

F#4 ( 相同 音量 ) F#5 (相同 音量 ) 

G4 G5 

G#4 G#5 

A#4 A#5 + B3 

B4 (KË) B5 (小 声 ) +B3 (小 声 ) 


图 13.2 两 声 部 的 无 限 循环 , 左 列 为 低音 的 渐 强 , 右 列 为 高 音 的 渐 弱 ; 左 列 到 B4 时 ， 
刚好 能 接 上 右 列 的 C5; 同 理 ， 右 列 弱 至 B5 时 ， 会 再 增加 一 个 同样 小 声 的 
B3 音 进来 ， 从 而 可 以 自然 过 渡 到 左 列 的 C4 上 


有 趣 的 是 ， 这 种 循环 ， 我 们 不 仅 能 在 音乐 中 看 到 ， 还 能 在 很 多 方面 见 
到 类 似 的 情形 。 比 如 艺术 作品 中 ， 前 面 提 到 过 的 荷兰 著名 画家 艾 铭 尔 就 画 
过 一 系列 无 限 循环 的 作品 。 如 图 13.3 所 示 的 水 的 循环 流动 、 楼 梯 的 “循环 ”， 
还 有 画 里 画 外 的 蜥 蝎 。 这 些 都 是 现实 世界 不 可 能 实现 的 无 限 循环 。 

而 在 日 常生 活 中 ， 也 可 见 许 多 旋转 现象 ( 图 13.4 )， 如 理发 店 的 旋转 灯 
简 也 有 着 无 限 循环 的 影子 。 关 于 这 种 灯 简 是 何 时 出 现 的 说 法 很 多 ， 有 说 是 
世界 大 战 时 期 ， 有 说 是 法 国 大 革命 时 期 。 其 中 一 种 说 法 是 为 了 纪念 一 位 为 
国家 ( 法国 ) 做 出 贡献 的 理发 师 , 旋转 灯 简 的 红 白 蓝 三 色 其 实 是 法 国 的 国旗 。 
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A133 艾 舍 尔 的 各 种 循环 画 
(a) 瀑布 (1961， 石 版 画 ) ; (b) 上 升 和 下 降 (1960， 石 版 画 ) ; (c) 画 
里 画 外 的 爬行 动物 ( 1943， 石 版 画 ) 


m 


(a) (b) 
A134 日 常生 活 中 的 旋转 现象 
北 卡罗来纳 历史 博物 馆 展 出 的 ，1938 年 理发 店 的 灯箱 (a) ; 可 以 双 倍 提高 使 
用 率 的 打印 机 色 带 (p) 四 


不 管 来 自 何 种 典故 ,灯箱 的 旋转 ,会 让 人 产生 循环 往复 、 一 直 向 上 的 
错觉 。 这 是 在 理发 店 的 无 限 循环 。 

事实 上 ， 这 种 循环 性 ， 我 们 在 20 世纪 曾 广泛 使 用 ， 现 在 主要 用 于 打印 
各 种 增值 税 发 票 的 针 式 打印 机 上 也 能 见 到 。 大 家 可 以 拆 开 色 带 看 看 ， 就 会 
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发 现 色 带 都 是 两 面 交 替 打 印 的 ， 如 图 13.4 (b )， 因 为 这 样 可 以 使 色 带 的 上 
半 部 和 下 半 部 都 能 完成 打印 ， 从 而 双 倍 提高 色 带 的 利用 率 。 这 是 打印 机 里 
的 无 限 循 环 ， 是 1991 年 由 英国 的 伊 轧 * W. 霍 加 思 (Ian W. Hogarth ) 和 瑞 
典 的 弗 里 德 黑 尔 姆 . LSC (Friedhelm Kiewning ) 提出 的 发 明 专 利 四 。 

这 种 循环 的 几何 结构 有 个 数学 味 更 浓 的 名 字 ， 叫 莫 比 乌 斯 带 ( Mobius 
band )， 它 可 以 将 纸 按 图 13.5 (a) 所 示 方 法 折 成 。 类 似 地 ， 普 林 斯 顿 大 学 
教授 、 作 曲 家 和 音乐 理论 专家 ; 迪 米 特 里 * 泰 莫 蒋 科 (Dimitri Tymoczko ) 
在 假定 十 二 音律 是 一 个 圆 形 循环 的 基础 上 ， 认 为 两 音符 组 成 的 音程 关系 可 
以 表示 成 如 图 13.5 (b) fidc ec PHF ME EEE PA J Leg ay 0791. 


(a) (b) (c) 
图 13.5 莫 比 乌 斯 带 ( Mobius band ) 
(a) 莫 比 乌 斯 带 折 法 : 将 纸 按 箭头 方法 对 折 后 再 粘 在 一 起 ， 便 可 以 获得 莫 比 
fd: (b) 两 音符 音程 关系 可 以 视 为 莫 比 乌 斯 带 [; (c) RAMP (LS 
尔 ，1963 年 ， 木 刻画 ) 


图 13.5 (e) 中 ， 艾 舍 尔 的 莫 比 乌 斯 带 开 的 木刻 画 也 很 有 意思 。 如 果 
让 一 只 不 会 飞 、 只 能 生活 在 二 维 空间 的 蚂蚁 沿 着 莫 比 乌 斯 带 怜 行 。 假 如 这 
个 带子 足够 宽 ， 蚂 蚁 只 能 向 前 怜 ， 那 么 它 可 以 一 直 向 前 朴 下 去 ， 却 不 能 发 
现 这 个 带子 是 否 有 正 有 反 。 用 更 严谨 的 话 来 表达 ， 假 定 你 在 一 个 点 上 坚 一 
R 垂 直 的 杆子 ， 或 者 称 为 曲面 上 该 点 的 法 向 量 ， 然 后 将 杆子 保持 与 纸 面 的 
: 直 一 直 向 前 挪动 ， 结 果 你 会 发 现 当 杆子 运动 到 背面 该 点 位 置 时 ， 这 根 垂 


EM 


LH 
Im 
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直 杆 子 的 方向 与 最 初 正 面 的 方向 刚好 是 相反 的 。 一 个 点 上 出 现 了 两 个 相反 
的 垂直 杆子 ， 这 种 矛盾 的 情况 导致 莫 比 乌 斯 带 面 上 的 点 都 没有 确定 的 方向 ， 
称 为 无 定向 的 曲面 。 

在 三 维 空间 中 ， 这 种 二 维 曲面 还 可 以 构造 ， 但 是 否 存在 一 个 三 维 无 
定向 的 结构 呢 ? 理论 上 是 有 的 ， 即 克 莱 因 瓶 (Klein bottle )， 如 图 13.6 所 
示 。 这 个 瓶子 有 个 神奇 的 特点 。 如 果 有 药片 放 在 瓶子 里 的 话 ， 不 用 开 瓶 盖 
就 能 把 药片 拿 出 来 。 这 对 于 拧 不 开 瓶 盖 需 要 找 男 同胞 帮忙 的 女性 朋友 们 绝 
对 是 个 福音 。 因 为 在 三 维 空间 中 ， 能 不 打开 瓶 盖 就 拿 出 瓶 内 药片 的 ， 似 乎 
只 有 魔术 师 可 以 做 到 。 不 过 很 遗憾 ， 在 三 维 空间 中 无 法 构造 出 真正 的 克 莱 
因 瓶 实体 ， 需 要 更 高 维度 的 空间 ， 而 这 种 升 维 技巧 在 现实 生活 中 还 无 法 
做 到 。 

除了 莫 比 乌 斯 带 和 克 莱 因 瓶 这 两 个 稍 显 古 怪 的 几何 结构 外 ， 日 常生 活 
中 ， 我 们 还 能 见 到 大 量 的 几何 结构 ， 如 甜 甜 圈 、 杯 子 、 花 瓶 等 。 如 何 确定 
它们 的 几何 结构 呢 ? 这 些 结构 能 否 用 于 人 工 智 能 呢 ? 


(a) (b) (c) 
A 13.6 ## AMR 
(a) 克 菜 因 瓶 示意 图 ; (b) 图 像 边缘 构成 的 克 菜 因 瓶 ， 不 同 颜 色 表示 不 同 的 
eae, (c) RA ARAR” 
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常见 研究 几何 结构 的 理论 ， 有 初等 几何 、 高 等 几何 、 射 影 几何 等 ， 再 
深 一 点 还 有 研究 曲面 不 变性 如 高 斯 第 一 性 、 高 斯 第 二 性 的 微分 几何 ， 再 复 
杂 些 就 是 代数 几何 (algebra geometry ) 和 代数 拓扑 ( algebra topology )。 我 
们 这 里 不 谈 这 两 个 数学 分 支 中 复杂 和 抽象 的 理论 ， 着 重 介绍 拓扑 。 拓 扑 是 
分 析 几 何 图 形 或 空间 在 连续 改变 形状 后 仍 能 保持 不 变性 的 理论 ， 俗 称 橡 皮 
几何 学 理论 。 比 如 一 个 杯子 ， 如 果 给 它 加 个 把 手 ， 它 的 拓扑 结构 就 变 了 。 
因为 多 了 一 个 洞 ， 它 也 就 没 办 法 在 不 改变 结构 的 情况 下 变 成 原来 的 杯子 了 。 
在 拓扑 学 发 展 历史 中 ,著名 的 哥 尼 斯 堡 七 桥 问题 、 多 面体 欧 拉 定 理 、 四 色 
问题 等 都 是 其 中 的 重要 问题 。 而 如 果 想 直观 感受 一 下 拓扑 的 魅力 ， 不 妨 买 
个 中 国 的 传统 智 环 类 民俗 玩具 ( 如 九 连环 ) 来 玩 玩 ， 它 和 拓扑 密切 相关 。 

那么 如 何 从 拓扑 角度 判断 两 个 形变 的 结构 具有 相同 拓扑 性 质 呢 ? 拓 
扑 学 家 们 定义 了 一 些 直观 的 参数 。 最 简单 的 参数 如 凸 多 面体 上 的 顶点 数 
(vertex ), X (edge) 和 面 数 (face )。 利 用 这 3 个 参数 的 交错 和 可 以 确定 
多 面体 的 一 个 不 变量 ， 叫 欧 拉 示 性 数 (Euler characteristic )。 比 如 三 角形 ， 
它 的 顶点 为 3， 棱 数 为 3， 面 数 为 2 ( 把 外 部 数 在 内 )， 那 么 它 的 欧 拉 示 性 
数 就 等 于 天 E+F=2。 这 里 我 们 把 顶点 视 为 零 维 空间 ， 边 或 楼 看 成 是 一 维 空 
间 , 平面 看 成 是 二 维 空间 。 如 果 和 希望 向 高 维 空间 推广 ， 我 们 可 以 继续 用 这 
样 的 交错 来 估计 高 维 拓扑 结构 的 不 变量 。 不 过 得 换个 稍微 专业 点 的 名 字 ， 
HY Betti 数 ( Betti number )。 如 第 零 维 的 Betti Bb, 表示 连通 分 量 ( connected 
components ) 的 数量 ， 第 一 维 b, 表示 有 圆 形 洞 (circular) 的 数量 ， 第 二 维 
b, 表示 有 二 维 球形 洞 ( void 或 cavities ) 的 数量 。 以 图 13.7 所 示 甜 甜 图 为 例 ， 
它 只 有 一 个 连通 分 量 ，bo=1 ; 但 有 两 个 圆 形 洞 ， 所 以 5,72 ; 有 一 个 二 维 结 
构 构 成 的 空洞 (void )。 那 么 ， 它 的 欧 拉 示 性 数 则 是 这 些 按 维 数 获得 的 Betti 
数 分 量 的 交错 和 ， 即 Bo-bi+22=-0。 
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图 13.7 7 维 空间 的 甜 甜 圈 的 拓扑 示意 图 


拓扑 学 的 研究 在 计算 机 图 形 学 方面 有 着 异常 重要 的 地 位 ， 因 为 图 形 学 
里 涉及 的 结构 变形 、 几 何 结构 分 析 上 都 离 不 开 它 。 但 是 在 人 工 智能 里 怎么 
使 用 拓扑 呢 ? 

与 图 形 学 不 同 ， 人 工 智 能 中 有 的 主要 是 数据 。 每 个 数据 点 都 是 离散 的 、 
有 噪声 的 。 如 果 直 接 利用 拓扑 学 的 概念 ， 并 不 好 处 理 ， 因 为 Betti 数 的 估计 
需要 连续 的 结构 。 不 过 幸运 的 是 ， 数 学 家 们 发 明了 一 套 新 的 办 法 来 研究 数 
据 中 的 拓扑 ， 叫 持续 同调 (persistent homology ) 外 。 名 字 很 学 术 ， 理 论 也 
相对 复杂 。 所 以 ， 我 在 这 里 用 一 个 不 太 精确 但 可 以 直观 理解 的 方式 来 解释 。 

如 果 用 五 线 谱 来 比拟 ， 一 个 音 是 一 个 结构 。 但 人 唱 这 个 音 的 时 候 会 有 
细微 的 抖动 ， 通 常 几 赫 效 到 几 十 赫 效 。 如 果 在 这 个 差异 范围 内 变化 ， 他 人 
听 不 出 来 ， 那 么 我 们 仍然 可 以 认为 这 些 音 是 同一 个 调 的 。 那 么 ， 这 个 从 最 
小 变化 到 最 大 不 可 区 分 音调 的 变化 区 间 就 是 这 个 音 所 具有 的 生命 力 ， 称 为 
持续 性 。 另 外 ， 如 果 这 个 音 出 现时 间 非 常 短 ， 那 它 就 不 会 被 认为 是 稳定 的 ， 
可 能 只 是 跑 调 或 破 音 了 。 要 找 主旋律 ， 这 些 生 命 力 短 的 音 可 以 忽略 不 计 。 
保留 下 来 的 就 是 那些 稳定 或 有 较 长 生命 力 的 同调 的 音 了 。 
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与 音调 不 同 的 是 ， 数 据 中 的 持续 同调 是 希望 找到 一 些 在 一 定 范围 内 
稳定 不 变 的 几何 结构 。 那 如 何 去 寻找 范围 呢 ? 科学 家 们 想到 了 可 以 用 一 
组 能 连通 的 三 角形 或 学 术 上 要 求 更 严谨 的 名 字 “ 单 纯 复 形 ”( simplicial 
complex )， 或 半径 可 变 的 圆 来 实现 。 

如 图 13.8 (a) 所 示 有 7 个 数据 点 ， 如 果 给 一 组 比较 小 的 三 角形 或 半 
径 小 的 圆 ， 则 这 些 圆 在 连通 意义 下 不 能 覆盖 全 部 数据 。 因 此 ， 可 以 在 保证 
连通 性 的 情况 下 ， 将 所 有 数据 点 通过 若干 相互 连通 的 圆 来 覆盖 。 因 为 这 些 
圆 的 大 小 限制 ， 中 间 的 空洞 不 会 被 填充 。 所 以 ， 最 终 连 通 成 的 圆 形 集合 会 
保留 原来 的 几何 结构 。 我 们 可 以 根据 这 个 圆 形 集合 形成 的 结构 来 估计 它 在 
不 同 维度 上 的 Betti 数 是 多 少 。 这 些 Betti 数 可 以 作为 数据 分 析 的 一 组 特征 ， 
也 可 以 用 来 估计 欧 拉 示 性 数 。 因 为 数据 是 离散 的 ， 如 果 要 找 一 个 稳定 的 几 
何 结构 ， 那 么 可 通过 增加 圆 的 半径 来 完成 对 数据 集合 的 多 次 覆盖 ， 直 到 数 
据 集合 中 的 被 连通 的 圆 的 集合 完全 填充 。 最 终 ， 原 来 能 看 到 的 拓扑 结构 如 
空洞 就 会 终止 ， 而 对 应 的 Betti 数 的 持续 性 或 生命 力也 会 消逝 ， 并 出 现 新 的 
拓扑 结构 。 


(a) (b) (c) 
A 13.8 从 数据 点 中 用 圆 形 履 盖 来 提取 拓扑 结构 
Ak (Ca) ~ (c): 采用 不 同 半 径 履 盖 蓝 点 数据 后 ， 可 以 得 到 不 同 的 拓扑 结构 。 
持续 同调 需要 找到 的 是 具有 足够 稳定 性 的 拓扑 结构 
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我 们 将 稳定 的 拓扑 结构 提取 出 来 ， 与 已 知 目标 的 拓扑 结构 进行 匹配 ， 
这 样 就 能 知道 数据 集合 与 哪 种 形式 的 结构 最 相似 。 

另外 ， 直 接 在 数据 上 做 推测 也 不 是 完全 合理 的 ， 因 为 数据 是 有 噪声 的 。 
当 数 据 量 过 大 的 时 候 ， 噪 声 的 波动 会 破坏 原来 的 几何 结构 ， 比 如 导致 原来 
不 在 一 起 的 两 个 位 置 直 接连 在 短路 ， 形 成 短路 边 。 所 以 ， 我 们 还 得 用 一 些 
采样 技术 来 适当 地 稀 琉 化 数据 。 

这 样 做 能 否 发 现 一 些 有 意思 的 现象 呢 ? 斯 坦 福 大 学 的 古 纳 尔 ' 卡尔 森 
( Gunnar Carlsson ) 教授 等 人 曾经 对 自然 图 像 做 过 实验 中。 他 们 将 图 像 切 成 
若干 小 块 ， 每 块 上 只 有 朝向 不 同 的 边缘 ,他 们 对 这 些 边 缘 图 像 块 进行 采样 ， 
然后 再 利用 不 断 变 大 的 三 角形 来 连通 和 勾画 图 像 块 集合 的 拓扑 结构 。 结 果 
他 们 发 现 自然 图 像 的 边缘 图 像 块 集合 构成 的 结构 和 克 莱 因 瓶 很 相似 ， 如 
图 13.6 (b )。 这 是 第 一 个 与 拓扑 相关 、 比 较 有 意思 的 发 现 。 

在 实际 应 用 中 ， 还 是 能 看 到 一 些 它 的 应 用 。 比 如 手语 识别 上 ， 因 为 手 
语 的 结构 具有 一 定 的 拓扑 性 质 。 我 们 也 曾 将 其 用 于 图 像 的 目标 识别 中。 

需要 提醒 的 是 ， 仅 用 拓扑 结构 来 构造 目标 识别 系统 是 有 风险 的 。 比 如 
图 13.9 所 示 的 、 带 把 手 的 咖啡 杯 和 实心 甜 甜 圈 这 种 一 眼 就 能 区 分 的 目标 ， 
从 拓扑 学 家 的 角度 来 看 却 
是 分 不 清 的 。 

更 重要 的 是 ， 将 这 类 
方法 用 于 高 维 数据 分 析 还 
存在 一 个 问题 : 这 些 基 元 指 
标 如 Betti 数 是 基于 人 对 三 
维 空间 的 直觉 来 获得 的 ; 至 
于 高 维 空间 是 否 还 存在 一 
些 特别 的 基 元 ， 人 类 还 无 


图 13.9 ”咖啡 杯 和 甜 甜 圈 的 拓扑 不 可 区 分 示意 图 
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法 感知 。 也 许 存在 更 复杂 的 高 维基 元 ， 只 是 无 法 感知 和 想象 而 已 。 要 解 开 
这 个 难题 ,或 许 和 和 解 开 萌 罗斯 超 弦 理论 中 隐藏 的 高 维 结构 一 样 困难 。 

所 以 ,单纯 依赖 拓扑 结构 来 完成 人 工 智能 中 常常 面临 的 预测 任务 ， 现 
阶段 很 有 可 能 会 陷入 与 “量子 计算 用 于 人 工 智 能 ”一 样 、 看 上 去 很 美的 塌 
粹 境界 ， 因 为 “不 是 不 好 ,时辰 未 到 ”。 

不 过 ， 理 解 音乐 、 艺 术 、 数 据 中 的 几何 或 拓扑 结构 ， 对 于 改善 对 智能 
体 发 育 和 犯错 机 制 的 了 解 ， 必 将 大 有 神 益 。 
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— 我 思 故 我 在 


我 思 故 我 在 。 这 是 笛 卡 儿 的 一 句 很 有 名 的 哲学 命题 ， 意 思 是 我 思考 了 ， 
便 证 明了 我 的 存在 ， 证 明了 我 躯体 的 存在 。 可 是 ， m 
体 是 我 自己 的 ， 而 不 是 别人 的 呢 ? 我 们 有 没有 可 能 将 其 他 物体 如 桌子 、 椅 
子 甚至 虚拟 的 物品 看 作 是 自己 身体 的 一 部 分 呢 ? 


胶体 与 智能 的 发 育 

人 类 对 外 部 世界 尤其 是 远 距 离 的 感知 主要 通过 视觉 、 听 觉 来 完成 ， 而 
执行 任务 则 无 法 仅 通过 这 些 感知 系统 或 只 靠 思考 就 能 实现 ， 虽 然 人 类 一 直 
期 待 能 理解 和 掌握 《星球 大 战 》 中 尤 达 大 师 的 原 力 (the force )。 记 得 小 朋 
友 小 时 候 曾 在 外 面 玩 过 一 款 基于 脑 电 波 来 控制 “迷你 足球 "射门 的 对 抗 游戏 。 
当 她 戴 上 测 脑 电波 的 头套 ， 手 握 好 金属 棒 ， 便 开始 集中 注意 力 思 考 ， 最 终 
轻松 战胜 了 一 位 比 她 高 半 个 头 的 小 男孩 。 后 问 其 经 验 ， 告 知 :无 他 ， 手 用 
力 抓 紧 金属 棒 即 可 ”。 虽 然 近年 来 在 原 力 的 探测 上 已 经 有 了 很 长 足 的 进步 ， 
如 日 本 的 科研 机 构 一 直 在 研究 脑 电 波 控制 轮椅 。 但 由 于 时 间 分 辨 率 和 空间 
分 辩 率 的 限制 ， 现 有 的 脑 电波 检测 设备 ， 甚 至 那些 可 侵入 大 脑 的 检测 设备 
都 还 无 法 真正 对 大 脑 的 思维 模式 形成 全 方位 的 了 解 ， 离 真正 的 实用 化 还 有 
相当 的 距离 。 
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古人 和 其 他 智能 体 就 更 不 能 理解 原 力 了 。 在 无 法 直接 利用 原 力 的 情况 
下 ,肢体 自然 就 成 了 执行 智能 体 任务 的 首选 。 而 直立 行走 ， 又 让 人 类 向 高 
级 智能 体 迈 出 了 重要 一 步 。 尤 其 在 学 会 农耕 种 植 、 有 策略 的 捕食 猎物 后 ， 
负责 解决 生存 压力 的 肢体 便 被 解放 出 来 ， 多 余 的 时 间 可 以 用 来 聊 八 卦 、 发 
展 语言 四、 玩 音乐 、 跳 广场 舞 ; 而 笑 子 的 使 用 可 能 会 让 国人 在 移动 增强 智 
能 体 的 路 上 走 得 更 快 。 因 为 当 西方 人 还 在 一 手 拿 刀 一 手 拿 又 吃 饭 的 时 候 ， 
国人 已 经 可 以 边 吃饭 、 边 拿手 机 做 各 种 拓展 知识 的 训练 了 ， 如 玩 手 游 、 朋 
友 圈 聊天 。 所 以 ， 肢 体 也 是 智能 发 育 的 一 个 关键 因素 。 然 而 ， 肢 体 的 作用 
并 非 一 出 生 就 在 人 类 这 个 智能 体 上 显现 了 。 

在 最 初出 生 的 阶段 ， 人 类 的 肢体 几乎 毫 无 作用 。 相 比 小 鹿 出 生 就 能 行 
走 来 说 ， 新 生 儿 最 多 能 挥 挥 肉 肉 的 小 手 、 足 几 下 腿 ， 理 应 是 食物 链 上 最 弱 
势 、 最 易 被 淘汰 的 一 类 。 但 偏偏 人 类 不 太 需 要 在 生存 上 考虑 太 多 ， 因 为 父 
母 的 保护 已 经 足够 了 。 如 果 观 察 新 生 儿 的 发 育 ， 就 能 发 现 多 数 新 生 儿 的 肢 
体 要 到 “七 坐 八 候 ” 这 个 阶段 才 开始 逐渐 施展 其 能 力 。 多 数 孩 子 要 到 一 岁 
左右 的 时 候 才 学 会 直立 行走 。 

可 是 ， 从 智能 体 的 角度 来 看 ， 肢 体 发 育 的 严重 滞后 性 也 许 并 不 是 劣势 ， 
反而 在 帮助 人 形成 由 粗 到 细 的 发 育 结构 中 起 到 关键 作用 。 英 国 科 学 家 德 斯 
蒙 德 . 莫 利 斯 ( Desmond Morris ) 写 于 1967 年 的 关于 人 类 行为 的 书 《 裸 猿 ) 中 ， 
将 这 一 状态 称 为 幼 态 保持 (neoteny ) 四 。 因 为 有 了 肢体 发 育 的 滞后 以 及 视 
觉 由 粗 到 细 的 发 育 ， 新 生 儿 才能 相对 方便 和 快速 地 对 各 种 目标 建立 大 概 的 
视觉 印象 。 

在 此 基础 上 ， 新 生 儿 的 肢体 才 开始 对 目标 有 了 接触 。 在 原 有 的 粗糙 印 
象 上 ， 建 立 了 目标 的 三 维 结构 ， 了 解 目标 的 旋转 不 变性 , 学 习 了 目标 离 自 
身 的 远近 感 。 再 学 会 精准 地 抓 取 物 品 ， 通 过 和 触觉 感受 物体 的 精细 纹理 。 继 
而 学 会 了 对 物体 的 自动 分 类 ， 以 及 目标 之 间 的 相互 匹配 和 关联 。 再 长 大 一 
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点 ， 就 到 了 可 以 写作 业 的 年 龄 了 。 

肢体 尤其 是 上 肢 帮 助人 类 衍生 了 太 多 生存 以 外 的 功能 ， 如 玩乐 器 和 各 
种 依赖 器 械 的 体育 运动 。 它 也 促进 了 交流 和 理解 ， 帮 助 表 达 人 类 的 情绪 。 
网 络 随便 查 查 ， 便 可 发 现 不 少 分 析 人 类 动作 和 微 动作 的 文献 。 它 还 让 人 对 
形体 有 了 审美 方面 的 意识 。 如 男性 照 镜子 时 总 觉得 自己 像 肌 肉 男 ， 女 性 则 
总 觉得 自己 太 胖 了 。 在 某 种 程度 上 , 这 可 以 看 成 是 性 别 差异 形成 的 身材 错觉 。 

肢体 发 育成 熟 后 ， 甚 至 能 够 脱离 视觉 和 听觉 的 影响 ， 依 然 可 以 独立 完 
成 多 种 任务 ， 比 如 在 黎明 来 临 前 闭 着 眼 准 确 地 把 床头柜 上 提醒 上 班 的 闹钟 
关 掉 再 继续 睡 。 这 说 明 上 肢体 已 经 具备 了 类 似 GPS 般 的 精确 定位 能 力 。 

如 果 不 信 ， 大 家 不 妨 试 试 用 上 眼睛 ， 将 一 只 手 放 在 额头 上 ， 另 一 只 手 
的 食指 碰 到 鼻子 ， 再 把 食指 碰 到 另 一 只 手 的 小 指 。 相 信 大 家 都 能 完成 。 这 
个 过 程 没有 借助 视觉 ， 是 大 脑 通过 神经 对 肢体 运动 的 精确 预测 和 控制 来 完 
成 的 。 学 术 上 称 其 为 本 体感 觉 ( proprioception )， 是 身体 运动 器 官 如 肌肉 、 
肌 腿 、 关 节 等 在 不 同 状态 ( 运动 或 静止 ) 时 产生 的 感觉 。 

看 似 轻而易举 的 运动 功能 ， 它 的 获得 其 实 经 历 了 一 段 长 的 学 习 过 程 ， 
从 视听 觉 、 触 觉 的 感知 到 不 借助 这 些 感知 器 的 本 体感 觉 ， 再 通过 对 躯体 各 
种 运动 模式 的 反复 学 习 ， 烙 印 在 大 脑 皮质 运动 功能 区 ， 最 终 固化 。 现 在 我 
们 能 研究 的 智能 机 器 人 ， 多 依赖 于 视觉 、 红 外 、 超 声 等 传 感 设备 ， 如 果 关 
闭 这 些 , 它 还 能 像 人 类 一 样 只 依赖 本 体感 觉 来 正常 抓 取 物体 吗 ? 这 应 该 是 
值得 研究 的 问题 。 

我 们 也 很 难 想象 ， 没 有 肢体 的 发 育 ， 智 能 体能 发 育 到 怎样 的 程度 。 所 
以 ， 有 科学 家 认为 ， 肢 体 是 智能 发 育 的 必要 组 成 部 分 。 如 果 只 研究 大 脑 ， 
不 分 析 肢 体 的 作用 ， 不 帮助 肢体 学 习 运 动 功能 ， 可 能 无 法 完全 理解 智能 。 
比如 密歇根 ( Michigan ) 大 学 的 翁 巨 扬 教 授 研究 的 自主 心智 发 育 ( autonomous 
mental development ) 9， 就 将 肢体 发 育 看 成 是 智能 体 自主 心智 发 育 的 重要 
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环节 之 二 。 
可 是 ， 肢 体 是 如 何 被 认同 为 自己 的 ， 而 不 是 别人 的 呢 ? 这 涉及 肢体 认 
知 上 存在 的 一 些 错觉 。 


幻 肢 错 觉 和 出 体 错觉 


自己 的 肢体 之 所 以 被 认同 为 自己 的 ， 而 非 他 人 的 ， 是 一 系列 感知 系统 
的 协同 作用 获得 的 ， 包 括 视觉 、 听 觉 和 本 体感 觉 等 。 如 果 在 这 些 联动 环节 
上 出 了 问题 ， 就 有 可 能 产生 肢体 错觉 。 它 包括 生理 缺失 引起 的 、 本 体感 觉 
引起 的 和 人 为 诱导 的 3 种 错觉 。 

生理 缺失 的 错觉 ， 称 为 幻 肢 错觉 (phantom limb )， 常 发 生 在 截肢 后 的 
患者 身上 。 患 者 会 感觉 被 切断 的 肢体 仍然 存在 ， 且 在 该 处 尤其 是 离 截肢 位 
较 远 的 远 端 会 非常 疼痛 。 根 据 临 床 报告 ， 有 50% 以 上 的 截肢 患者 术 后 有 幻 
肢 痛 的 经 历 。 痛 感 的 感受 有 多 种 ， 有 电 脉 冲 式 的 电击 痛感 ， 也 有 切割 痛感 、 
撕 裂 或 烧伤 痛感 。 截 至 目前 ， 对 幻 肢 痛 的 发 生 原 理 ， 有 两 种 相对 合理 猜测 。 
一 是 认为 截肢 后 会 出 现 大 脑 皮质 功能 重组 (cortical reorganization ), 一 是 认 
为 体 表 某 些 区 域 如 双 侧 面部 、 颈 部 、 上 胸部 和 上 背部 存在 诱发 幻 肢 痛 的 触 
发 区 (trigger zone )。 但 总 体 来 看 ， 仍 无 统一 的 意见 ， 也 没有 有 效 的 办 法 来 
治疗 幻 肢 痛 。 

本 体感 觉 引 起 的 错觉 ， 则 是 由 于 协调 机 制 出 了 问题 导致 的 。 其 中 最 著 
名 的 错觉 是 亚 里 士 多 德 错觉 (Aristotle illusion )。 如 果 将 两 个 相 邻 的 手指 ， 
如 中 指 和 食指 ， 交 叉 后 去 摸 自己 的 鼻子 或 者 物品 如 一 颗 鸡 豆 ， 有 些 人 会 感 
觉 有 两 个 鼻子 或 两 颗 吾 豆 。 原 因 是 大 脑 从 没有 考虑 过 相 邻 手指 可 以 交叉 后 
摸 物 品 ， 因 此 仍 会 像 平时 一 样 ， 将 手指 外 侧 传导 来 的 信号 单独 处 理 ， 导 致 

觉 分 离 ， 产 生 两 个 物体 的 错觉 。 

还 有 一 种 错觉 与 多 传感器 集成 (multisensory integration ) 的 不 一 致 有 关 , 

即 人 为 诱导 的 错觉 ， 它 涉及 人 是 如 何 认 知 自 己 的 躯体 是 自身 的 。 瑞 典 卡 罗 
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林 斯 卡 ( Karolinska ) 人 研究 所 的 享 里 克 … 埃 尔 森 (Henrik Ehrsson ) 教授 及 其 
研究 小 组 对 “人 是 如 何 将 肢体 视 为 身体 的 一 部 分 、 为 什么 我 们 会 感觉 自我 
在 躯体 内 ”这 一 问题 进行 了 长 期 的 研究 多。 他 认为 人 对 自身 的 认 知 是 多 
传感器 集成 ， 即 视觉 、 触 党 和 这 些 感觉 以 外 的 体感 系统 ( 本 体感 觉 ) 共同 
感知 的 结果 。 因 此 ， 如 果 将 这 几 种 感知 方式 剥离 开 来 ， 也 许 就 能 让 人 产生 
身体 的 错觉 。 为 验证 其 理论 ， 他 尝试 做 了 一 系列 的 试验 。 

他 首先 发 现 的 现象 是 基于 橡皮 手 错 觉 的 (图 14.1). 首先 , 实验 员 移 动 
每 个 参加 者 的 左 食 指 ， 使 其 触摸 到 右边 橡皮 手 食指 的 关节 ， 同 时 ， 实 验 员 
触摸 参加 者 右手 的 食指 。 实 验 中 需 保 证 触摸 这 两 只 手 的 动作 要 尽 可 能 同步 。 
当 两 只 手 触 摸 物体 的 频率 在 1Hz 时 ， 过 了 10 秒 左 右 后 ， 人 就 能 产生 橡皮 
手 是 自己 的 错觉 。 实 验 员 也 发 现 异步 触摸 或 非 一 致 性 模型 ( 如 使 用 毛笔 而 
不 是 橡皮 手 的 物品 )， 则 错觉 不 容易 出 现 。 

之 后 ， 他 做 了 进一步 的 实验 。 他 给 测试 者 戴 上 一 个 有 显示 器 的 护 目镜 ， 
并 在 测试 者 的 身上 放置 一 个 摄像 头 ， 让 测试 者 视觉 上 看 到 的 是 身后 摄像 头 
拍摄 的 情形 。 然 后 他 左右 手 各 拿 一 个 小 棍 ， 左 手 的 棍子 可 以 触 到 测试 者 身 
上 ， 碳 手 则 是 对 着 摄像 头 虚 空 挥舞 ( 图 14.2 )。 

在 训练 一 段 时 间 后 ， 埃 尔 森 教授 拿 着 锤子 对 着 摄像 头 挥 过 去 ， 结 果 测 


图 14.1 橡皮 手 错觉 ™ 图 14.2 ”出 体 错 觉 实验 的 设置 中 
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试 者 产生 了 身体 错觉 , 有 明显 的 向 后 仰 的 情况 。 这 说 明 , 测试 者 把 摄像 头 “ 看 
到 ”的 当成 了 “自我 >。 他 将 这 个 现象 称 为 出 体 错觉 (out-of-body illusion )。 
除 此 以 外 ， 他 又 做 了 一 组 实验 ， 在 一 个 虚拟 人 的 头 上 安装 了 一 个 向 自己 身 
体 下 方 看 的 摄像 头 ， 对 测试 者 也 同样 处 理 。 结 果 发 现 ， 如 果 对 虚拟 人 的 腹 
部 进行 锤 击 时 ， 测试 者 也 会 误 以 为 是 对 自己 的 身体 在 锤 击 。 他 推测 这 是 由 
于 第 一 视角 导致 的 “自我 "的 互 换 。 同 时 , 当 测 试 者 产生 “身体 交换 错觉 "时 ， 
他 们 也 观测 到 测试 者 参与 动作 的 视觉 引导 位 置 、 腹 外 侧 运动 前 皮质 ( ventral 
premotor cortex ) 会 变 得 很 活跃 。 这 种 “自我 ”的 互 换 甚至 在 不 同 尺度 的 情 
况 下 也 能 发 生 。 比 如 ， 让 测试 者 平 躺 着 , 戴 着 护 目镜 ， 然 后 在 摄像 头 前 放 
一 个 人 形 的 玩偶 , 但 尺寸 只 有 约 30cm Ko 重复 这 一 过 程 后 ， 如 触摸 玩偶 
的 手 、 用 很 小 的 积木 去 撞 玩偶 的 脚 ， 都 让 测试 者 误 以 为 是 在 自己 身上 的 操 
作 。 但 是 , 他 也 发 现 如 果 用 桌子 、 椅 子 来 蔡 代 时 , 则 不 会 有 这 种 自我 的 反应 。 

基于 以 上 实验 和 观察 ， 埃 尔 森 教授 认为 要 想 让 人 产生 完全 “自我 ”的 
身体 错觉 ， 需 要 4 个 基本 要 素 ， 第 一 视角 、 拟 人 的 身体 、 看 和 感觉 刺激 的 
同步 以 及 看 和 感觉 刺激 的 空间 一 致 性 。 满 足 这 4 个 条 件 ， 我 思 ， 很 有 可 能 
看 到 的 就 不 是 真正 的 自我 了 。 那 这 些 错觉 对 智能 体 的 研究 有 何 可 借鉴 的 地 
方 呢 ? 


虚拟 现实 、 外 骨骼 与 身材 

不 妨 看 看 当下 的 两 项 人 工 智能 相关 新 技术 ， 一 项 是 大 家 熟知 的 虚拟 现 
SE ( virtual reality, VR ) 及 其 推广 技术 。 如 将 真实 世界 与 虚拟 世界 无 颖 集成 ， 
将 计算 机 生成 的 场景 、 信 息 琶 加 到 现实 世界 中 ， 就 是 增强 现实 (augmented 
reality，AR )， 如 谷歌 眼镜 。 如 果 在 虚拟 环境 引入 现实 场景 ， 在 虚拟 、 现 
实 世 界 与 用 户 之 间 形 成 交互 的 反馈 回路 ， 则 为 混合 现实 (mixed reality， 
MR), 不 管 是 VR、AR 还 是 MR， 都 希望 提高 用 户 的 沉浸 感 和 体验 环境 的 
真实 性 。 有 些 还 会 在 戴 上 虚拟 现实 眼镜 的 同时 ， 增 加 立体 声 声场 刺激 。 在 
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商场 中 能 见 到 的 、 与 虚拟 现实 相关 的 娱乐 设备 ， 还 会 增加 辅助 设备 ( 如 旋 
转椅 ) 或 可 接触 身体 的 机 械 传 动 装置 ( 如 背部 的 触摸 杆 )， 来 让 人 有 更 真实 
的 体验 。 

而 这 些 技 术 ， 很 少 有 考虑 过 如 何 将 “自我 ”错觉 有 效 地 融入 VR, AR 
或 MR 中 。 但 从 前 面 所 述 内 容 不 难看 出 ,“ 自 我 ”错觉 能 帮助 获得 更 好 的 、 
身 临 其 境 般 的 体验 感 。 在 理想 情况 下 ， 甚 至 有 可 能 实现 像 史 蒂 文 * 斯 皮尔 
伯 格 拍摄 的 电影 《头号 玩家 》 的 情景 : 在 虚拟 的 世界 中 你 能 真正 感觉 到 “ 自 
我 ”的 存在 和 意义 。 虽 然 每 个 人 在 这 个 世界 中 只 是 个 动画 人 物 ， 但 如 果 该 
人 物 的 躯体 和 自身 的 躯体 在 “多 传感器 集成 ”意义 下 ， 变 得 不 可 区 分 时 ， 
那 人 类 在 未 来 虚拟 世界 的 生活 时 间 就 很 可 能 会 等 同 甚 至 超越 真实 世界 了 。 

其 次 ,“ 自 我 ”也 能 增强 外 骨骼 的 应 用 。 汽 车 驾驶 员 都 知道 ， 要 让 驾驶 
水 平 达 到 人 车 一 体 的 感觉 ， 拿 到 驾照 只 是 开始 ， 至 少 开 过 两 三 千 公 里 后 才 
会 有 “人 车 一 体 ”的 感觉 。 而 未 来 人 类 如 果 和 希望 获得 行动 能 力 和 人 力 不 可 
及 能 力 的 提升 ， 装 备 外 骨骼 可 能 是 一 种 最 直接 有 效 的 办 法 。 而 如 果 和 希望 更 
快速 地 让 人 习惯 和 使 用 外 骨骼 ， 形 成 人 与 外 骨骼 一 体 化 的 体感 ,“ 自 我 ” 错 
觉 的 介入 显然 是 有 帮助 的 。 有 些 实验 者 ， 可 以 通过 控制 让 测试 者 错误 以 为 
自己 有 “第 三 只 手 ”。 另 一 个 极端 的 例子 是 针对 截肢 患者 的 肢体 接 人 。 如 果 
将 “自我 ”错觉 引入 ， 则 会 让 患者 认同 自己 的 假肢 ， 从 而 可 能 避免 幻 肢 痛 
的 困扰 。 不 过 从 埃 尔 森 教 授 报道 的 实验 结果 来 看 ， 目 前 “自我 ”错觉 的 持 
续 时 间 还 不 长 , 还 难以 实现 长 时 间 的 “自我 ”认同 "3 。 因 此 , 要 利用 “自我 ” 
错觉 来 治疗 幻 肢 症 还 有 很 大 待 完 善 的 空间 。 但 可 以 肯定 的 是 ， 充 分 利用 好 
“自我 ” 认 知 的 错觉 ， 将 会 有 利于 我 们 更 灵活 地 使 用 如 “钢铁 侠 ” 般 的 外 骨 
骼 装备 。 

另外 ,“ 自 我 ” 认 知 的 错觉 还 能 影响 人 对 身材 的 满意 程度 ， 减 少 与 满意 
程度 相关 的 疾病 ， 如 厌食 症 。 最 新 的 研究 表明 ， 人 视觉 上 感知 的 身材 满意 
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程度 与 触 党 获得 的 是 不 同 的 。 因 此 ， 未 来 也 许可 以 考虑 利用 多 传感器 集成 
的 方法 来 减少 人 对 身材 不 满意 的 错觉 ， 从 而 减少 相关 疾病 的 发 生 "。 

说 不 定 在 若干 年 后 ， 当 电池 续航 时 间 、 通 信 效 率 、 载 重 问题 得 到 有 效 
解决 后 ， 我 思 ， 真 不 一 定 只 是 故我 在 了 ， 也 许 还 有 虚无 绎 绢 的 我 在 ， 三 头 
六 臂 的 我 在 ， 甚 至 其 他 千奇百怪 的 我 在 了 。 

如 果 把 视觉 错觉 、 听 觉 错觉 、 躯 体 错觉 都 看 成 是 身体 传 感 方面 的 错觉 ， 
那 有 没有 更 抽象 、 更 高 一 级 的 错觉 呢 ? 下 回 书 表 ! 
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=@ 可 塑 与 多 义 


人 之 初 ， 性 本 善 ; VAAL, DHL, HRM, WG; d 
zi, HA, HRA, HAL; 子 不 学 ， 断 机 标 。 罕 燕山 ， 
ALF; RAF, 名 俱 扬 。 养 不 教 , 父 之 过 ; 教 不 严 ， 师 之 情 。 
FRF, ETL; 幼 不 学 ， 老 何 为 ? BRR, 不 成 器 ; 人 不 学 ， 

不 知 义 。 为 人 子 ， 方 少时 ; 亲 师 友 ， 习 礼仪。 
一 一 《三 字 经 》 

作为 国学 启蒙 书籍 之 一 ,《 三 字 经 》 在 知识 的 简洁 表达 上 做 到 了 极致 。 
寥寥 数 笔 ， 人 的 性 格 养 成 、 子 女 教育 、 礼 义 廉耻 就 言 简 意 凡 地 表达 了 。 在 
让 人 知道 学 区 房 重 要 性 的 同时 ， 也 反映 了 另 一 层 事 实 ， 后 天 的 学 习 可 以 帮 
助 近乎 “ 白 纸 ”、 最 初 相 近 的 人 类 形成 了 多 样 性 的 “ 远 ”。 

从 人 工 智 能 的 角度 来 看 ,《 三 字 经 》 的 表述 方式 很 符合 1978 年 乔 尔 玛 ， 
里 萨 南 (Jorma Rissanen ) 提出 的 最 小 描述 长 度 原 则 ( minimum description 
length, MDL) "”。 直 观 来 说 ， 就 是 在 给 定 表达 集合 的 前 提 下 ， 产 生 最 大 
压缩 效果 而 又 不 丢失 信息 或 知识 的 表达 是 最 好 的 。 虽 然 背 后 的 原因 可 能 是 
毛笔 字 太 难 写 ， 能 少 写 就 尽量 少 写 。 反 观 现在 流行 的 说 唱 ， 似 乎 可 以 称 为 
最 少时 间 描 述 ， 因 为 需要 用 最 少 的 时 间 完 成 最 大 的 信息 量 传 递 。 

虽然 《三 字 经 》 强 调 学 习 的 重要 性 ， 但 关于 语言 是 如 何 习 得 的 ， 却 没 
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语言 学 习 的 次 序 与 可 塑性 

对 于 新 生 儿 来 说 ， 获 得 语言 能 力 的 时 间 比 获得 视听 觉 能 力 的 时 间 要 晚 
不 少 。 在 最 初 的 2-3 个 月 ， 新 生 儿 最 多 会 发 出 简单 的 象声词 ， 会 内 会 笑 。 
到 七 坐 八 朴 的 时 候 ， 开 始 能 理解 大 人 的 简单 对 话 ， 尤 其 是 当 内 容 与 婴儿 可 
以 接触 到 的 物体 相关 时 。 但 要 学 会 说 话 ， 还 得 耐心 地 等 到 1 岁 半 左 右 。2 
岁 以 后 ， 才 能 发 音 或 清晰 或 含糊 地 跟 成 人 交流 了 。 

由 此 可 见 ， 在 人 类 的 智能 发 育 中 ， 尽 管 从 出 生 开始 就 沉浸 在 相对 单纯 
的 语言 环境 中 ， 儿 童 的 语言 习 得 却 具 有 很 明显 的 滞后 性 。 这 种 滞后 性 一 方 
面 与 声带 练习 需要 时 间 有 关 ， 而 这 种 练习 可 能 是 为 了 配合 人 类 由 粗 到 细 的 
学 习 模 式 ， 是 演化 的 结果 ; 另 一 方面 也 可 能 与 人 脑 在 建构 具体 到 抽象 概念 
的 认 知 结构 的 次 序 有 关 ， 即 更 抽象 的 语言 学 习 需 要 建立 在 能 通过 感官 感觉 
到 的 概念 的 基础 之 上 ， 如 通过 视觉 、 听 觉 、 触 觉 获 得 的 概念 。 

在 交流 变 得 通畅 后 ， 儿 童 的 语言 学 习 就 开始 飞速 前 进 了 ， 最 后 会 进入 
稳定 期 , 一 如 成 人 一 样 。 不 过 并 非 年 龄 越 大 , 学 习 语言 的 能 力 就 越 强 。 比 如 ， 
在 外 语 学 习 方面 ， 有 一 个 比较 有 趣 的 拐点 错觉 ， 即 12 岁 以 前 学 习 外 语 往往 
被 语言 学 家 们 认为 是 黄金 时 期 。 和 夸张 地 讲 ， 这 个 阶段 的 儿童 在 全 英文 环境 
下 获得 的 英文 提升 能 力 的 效率 ， 大 概 是 成 年 人 在 相同 环境 下 的 6 倍 左右 。 

这 似乎 与 直觉 有 些 相 悖 ， 因 为 成 人 的 学 习 能 力 、 学 习 方 法 、 注 意 力 都 
应 该 更 高 效 。 但 是 ， 儿 童 学 习 外 语 的 优势 恰恰 又 在 于 这 个 弱势 ， 即 他 们 仍 
处 在 一 个 没有 完全 把 母语 的 语言 结构 固化 的 阶段 。 由 于 没有 固化 ， 就 不 容 
易 受 到 母语 的 影响 ， 就 有 可 能 形成 两 个 相对 更 独立 的 语言 认 知 模型 。 反 观 
成 年 人 的 外 语 学 习 ， 多 数 人 在 阅读 英文 文献 时 ， 可 能 都 会 下 意识 地 先 在 大 
脑 里 翻译 成 中 文 再 去 找 对 应 的 英文 意思 。 结 果 ， 成 年 人 要 完全 脱离 母语 去 
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思考 英文 就 需要 更 长 的 调整 时 间 。 这 说 明成 年 人 的 多 语言 结构 中 母语 具有 
更 强 的 优先 级 ， 且 对 新 语言 的 学 习 会 形成 明显 的 干扰 。 而 儿童 的 母语 结构 
的 优先 级 并 不 明显 ， 因 此 在 语言 学 习 时 有 更 强 的 可 塑性 。 很 有 意思 的 一 点 
是 ,这 种 可 塑性 是 在 构造 由 粗 到 细 的 学 习 模 式 的 中 段 而 非 终 段 发 生 的 。 

如 果 比 较 一 下 当今 人 工 智 能 对 新 模式 的 学 习 策 略 ， 就 能 发 现 ， 多 数 
是 在 模拟 终 段 的 学 习 。 不 管 是 零 样本 学 习 ( zero-shot learning ) 79, — 
个 或 少量 样本 学 习 (one-shot or few-shot learning ) !, £473 ( transfer 
learning ) P! 还 是 领域 自 适应 ( domain adaptation) 呈 ， 它 们 都 假定 了 有 革 
一 已 知 的 、( 接近 ) 固化 的 结构 在 其 中 ， 或 是 分 布 ， 或 是 几何 结构 ， 或 是 其 
他 某 种 假设 。 如 果 能 研究 一 下 人 类 在 发 育 的 不 同 阶段 的 学 习 模 式 ， 说 不 定 
能 让 目前 极 容易 固化 的 机 器 智能 得 到 更 强 的 可 塑性 。 

语言 学 习 中 的 整体 与 局 部 认 知 

语言 学 习 有 其 基本 的 规律 ， 首 先 要 学 会 的 是 识字 。 儿 童 识字 的 过 程 是 
从 看 图 说 话 开 始 的 ， 读 书 是 从 图 画 书 逐 渐 过 渡 到 少 图 甚至 无 网 的 书籍 。 这 
说 明了 有 具体 与 抽象 的 匹配 在 人 的 前 期 认 知 建构 非常 重要 。 那 么 ， 人 在 识字 
时 是 如 何 记忆 每 个 字符 的 呢 ? 

一 种 可 能 是 基于 由 粗 到 细 、 由 整体 到 局 部 的 记忆 模式 ， 因 为 这 与 人 的 
视觉 发 育 机 制 吻合 。 可 以 用 来 佐证 整体 记忆 的 例子 是 如 下 的 乱码 阅读 : 

The nghit bferoe lsat jsut berofe dnienr, wihle my ftaehr was lkooing trhugoh 
the envenig pepar; he sdduelny let out a cry of srpusrie. Letar he epxinaeld: “I 
had tohhugt taht he had deid at laset tewtny yares ago. But can you bleeive taht 
my fisrt tcheear, Mr. Crossett, is sitll liivng? ” 

这 段 文字 选 自 于 1984 年 人 民 教 育 出 版 社 的 高 级 中 学 英语 第 二 册 第 一 课 
(Portrait of A Teacher), 打 乱 字母 次 序 后 ， 看 上 去 很 混乱 ， 但 稍微 介 点 英文 
的 ， 应 该 能 不 太 费 力 地 将 每 个 拼 错 的 单词 自动 纠正 ， 并 把 全 文正 确 读 出 来 。 
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它 表明 人 在 记忆 英文 单词 或 名 子 时 ,会 优先 进行 整体 认 知 。 只 要 单词 中 的 
第 一 个 和 最 后 一 个 字母 次 序 保持 不 变 ， 人 就 可 以 准确 识别 。 整 体 认 知 的 情 
况 在 汉语 中 同样 存在 。 不 妨 阅 读 下 面 这 个 句子 : 

研 表 究 明 ， 汉 字 的 序 顺 并 不 定 一 能 影 阅 响 读 ， 比 如 当 你 完 看 这 和 句 话 后 ， 
还 没 发 这 现 里 的 字 全 是 乱 的 。 

显然 ， 只 要 没 改变 每 个 短 句 的 第 一 和 最 后 一 个 汉字 ， 相 邻 字 的 次 序 交 
换 也 不 会 影响 阅读 和 对 句子 意思 的 理解 。 整 体 认 知 也 能 解释 惯用 简体 字 的 
国人 为 什么 能 比较 轻松 地 识别 多 数 繁 体 字 。 因 为 多 数 情况 下 ， 繁 体 字 与 简 
体 字 的 字形 是 相近 的 。 甚 至 当 汉字 产生 字体 变化 时 ， 如 楷体 、 宋 体 、 行 书 ， 
基本 也 不 影响 人 对 汉字 的 理解 。 当 然 ,“ 医 生体 ”除外 。 

另外 ， 整 体 认 知 也 方便 人 识别 和 记忆 未 知 的 汉字 。 当 识别 结构 相似 、 
发 音 也 相同 的 汉字 时 ， 如 “ 唉 ”和 “楼 EAR” AT "IP, 
就 能 够 快速 地 获得 正确 的 发 音 。 如 果 观 察 儿 童 早期 的 文字 识别 ， 可 以 发 现 ， 
当 他 们 遇 到 不 认识 的 字 时 ， 会 在 大 脑 中 寻找 认识 的 、 相 似 字形 的 字 来 匹配 ， 
并 推测 未 知 字 的 发 音 。 但 当 遇 到 结构 相似 、 发 音 不 同 或 多 音 的 汉字 时 ， 如 
“ 锦 ” 和 “ 绵 ”“ 流 ”和 “ 航 ““ 途 ”和 “ 徐 "， 则 可 能 形成 错误 推广 。 比 
如 把 “什锦 糖 ” 错 读 成 shén mián 糖 。 这 些 错误 和 正确 的 推测 ， 表 明 儿 童 
在 建构 语言 记忆 模型 时 ， 可 能 会 将 字形 结构 类 似 的 字 放 在 相近 的 记忆 模型 
中 ， 以 提高 学 习 的 效率 。 

语言 断 句 和 释义 的 歧义 性 

认 知心 理学 的 分 支 之 一 、 格 式 塔 心理 学 强调 了 整体 认 知 的 重要 性 中。 
然而 ,这 一 理论 目前 还 没有 形成 太 好 的 量化 机 制 或 程序 化 方法 来 ， 它 使 得 
机 器 对 需要 整体 认 知 的 问题 还 一 筹 莫 展 。 除 此 以 外 ,语言 的 歧义 性 也 使 得 
人 类 在 语言 理解 上 ， 较 机 器 更 灵活 和 智能 ， 甚 至 多 了 些 茶余饭后 的 文字 游 
戏 。 如 以 下 示例 : 
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1. 自然 语言 处 理 领 域 常用 来 示例 的 歧义 句 : 

南京 市 长 江 大 桥 是 “南京 市 /长 江 大 桥 ” 还 是 “南京 市 长 / 江 大 桥 ”? 

2. 网 络 中 流传 的 两 个 段子 : 

(1) 改编 自 金庸 的 《 神 雕 侠 侣 》: 

来 到 杨过 曾经 生活 过 的 地 方 ， 小 龙 女 动情 地 说 :“ 我 也 想 过 过 过 过 儿 过 
过 的 生活 。” 

(2 )“ 行 ”字句 : 

人 要 是 行 , 干 一 行 行 一 行 ， 一 行 行 行 行 行 ; 

要 是 不 行 , 干 一 行 不 行 一 行 ， 一 行 不 行 行 行 不 行 

3. 古诗 新 解 : 唐 代 诗 人 杜牧 的 千古 名 作 之 一 、 七 绝 诗 《 清 明 》: 

清明 时 节 雨 纷纷 ， 路 上 行人 欲 断 魂 ，; 
借 问 酒家 何 处 有 ， 牧 童 过 指 查 花村 。 

因为 诗句 和 意境 表达 的 优美 ,一些 人 将 这 首 名 诗 做 了 很 多 改编 ， 形 成 
了 十 余 种 形式 ， 读 起 来 别有一番 风味 。 举例 来 说 ， 如 果 不 按 古 诗 的 格式 ， 
而 是 按 散 词 的 形式 来 断 句 ， 就 会 多 一 层 俏皮 的 感觉 : 

清明 时 节 雨 ， 纷 纷 路 上 行人 ， 和 欲 断 魂 。 

借 问 酒家 何 处 ? 有 牧童 ， 遥 指 禁 花村 。 

不 仅 如 此 ， 我 们 还 可 以 将 此 诗 改写 成 微型 短 剧 : 

时 间 : 清明 时 节 

地 点 : 路 上 

精神 状态 : 行人 和 欲 断 魂 

对 白 : 借 问 酒家 何 处 有 ? 

另 一 主要 人 物 : 牧童 

动作 : REAR 
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远景 : AUER 

可 见 汉语 在 语意 表达 上 是 相当 丰富 的 。 汉 语 的 多 义 性 让 这 类 例子 不 胜 
枚 举 ， 再 看 两 例 同 义 / 反 义 和 多 义 的 例子 : 

EX/EX 

当中 国 女排 获得 世锦 赛 冠军 时 ， 媒 体 既 有 “中 国 女排 大 胜 美 国 女排 ”， 
也 有 “中 国 女排 大 败 美国 女排 ” 报道 ， 那 到 底 是 大 胜 还 是 大 败 呢 ? 

2. 多 义 性 

上 司 : 你 这 是 什么 意思 ? ”小 明 :“ 没 什么 意思 。 意 思 意 思 。” 上 司 :“ 你 
这 就 不 够 意思 了 。” 小明:“ 小 意思 , 小 意思 。” 上 司 :“ 你 这 人 真 
“其 实 也 没有 别 的 意思 .” 上司:“ 那 我 就 不 好 意思 了 。” 小 明 :“ 是 我 不 好 意思 。” 

请 问 以 上 “意思 ”分 别 是 什么 意思 ? 

这 些 都 是 机 器 理解 中 文 自 然 语言 的 难点 ， 而 国人 因为 有 背景 知识 的 支 
持 ， 理 解 起 来 就 相对 容易 了 。 除了 语言 自身 的 特点 ， 视 听觉 系统 也 会 对 语 
言 的 理解 有 着 重要 的 作用 。 

视听 觉 对 语言 的 影响 

u . 一 一 

俗话 说 “千言 不 如 一 画 "， 对 于 视觉 优 ”多 
先 的 人 类 而 言 ， 图 画 能 提供 更 丰富 和 具体 的 J 
信息 。 可 是 ， 如 果 语 言 搭 上 图 画 的 包装 , oy 
字面 的 意思 用 图 画 的 形式 表述 出 来 ， 那 即使 Fe 

P d 
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图 15.1 则 将 诗 中 的 形容 词 “ 长 、 短 、 大 、 横 、 瘦 、 断 、 斜 、 曲 、 倒 、 侧 ” 
等 通过 视觉 的 方式 融入 诗 里 的 名 词 中 ， 让 原本 已 经 很 美的 诗 更 添加 了 一 丝 
画面 感 。 

要 让 机 器 来 理解 这 种 有 画面 感 的 诗 ， 需 要 分 析 字 体 的 大 小 关系 、 方 向 
性 、 断 字 情 况 、 反 向 书写 、 局 部 字体 变化 与 诗词 的 关系 。 这 些 无 形 中 加 大 
了 机 器 分 析 语 言 的 难度 ， 更 不 用 说 理解 字画 的 意境 了 。 

不 仅 视觉 能 影响 人 对 语言 的 理解 ， 听 觉 也 能 影响 。 同 样 的 语句 ， 重 音 
不 同 ， 想 强调 的 内 容 就 差 不 少 。 比 如 : 

明天 别 忘 了 带 笔记 本 电脑 去 学 校 ! 

如 果 重 音 在 “明天 ”， 则 是 强调 时 间 ; 如 果 重 音 在 “ 别 忘 了 ”"， 则 是 强 
调 记性 ; 如 果 重 音 在 “笔记 本 电脑 ”， 则 是 强调 带 的 物品 ; 如 果 重 音 在 “学 
校 "， 则 是 强调 要 去 的 场所 。 

可 见 视听 党 的 融入 会 不 同 程度 地 影响 对 语言 的 理解 ， 导 致 机 器 分 析 的 
难度 上 升 。 

语言 与 音乐 的 循环 游戏 

除 此 以 外 ， 对 语言 的 巧妙 设计 还 能 衍生 出 不 少 有 趣 的 结构 ， 如 回 文 诗 。 
汉语 回 文 诗 有 很 多 形式 ， 如 从 诗 的 末尾 一 字 读 至 开头 一 字 可 成 新 诗 的 通体 
回 文 、 下 一 名 为 上 一 句 回 读 的 双 句 回 文 、 每 句 前 半 句 与 后 半 句 互 为 回 文 的 
就 句 回 文 、 诗 的 后 半 篇 为 前 半 篇 回复 的 本 篇 回 文 、 先 连续 至 尾 再 从 尾 连 续 
至 开头 的 环 复 回 文 ， 等 等 。 

虽然 什么 时 候 开始 有 回 文 已 无 从 考究 ， 但 从 古诗 词 中 可 以 找到 不 少 回 
文 许 。 传 说 北宋 时 期 ， 苏 小 妹 与 长 兄 苏 东 坡 六 月 荡 舟 西湖 时 ， 收 到 她 丈夫 
秦 少 游 撒 来 的 释 字 回 文 诗 书信 ( 图 15.2 ),“ 静 思 伊 久 阻 归期 忆 别 离 时 闻 漏 
Fe o 
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苏 小 妹 冰雪 聪明 ， 很 快 便 悟 出 
其 中 奥妙 ， 将 诗 解 读 出 来 : 
AREA ys, 久 阻 归期 忆 别 离 。 
忆 别 离 时 闻 漏 转 ， 时 闻 漏 转 静 思 伊 。 

并 回 诗 一 首 “ 采 莲 人 在 绿 杨 津 
一 疼 新 歌声 濑 玉 采 莲 人 ”。 苏 东 坡 
见 状 , PEHR, 也 即兴 提 笔 赋 诗 
一 首 “ 赏 花 归 去 马 如 飞 酒 力 微 醒 时 
已 著 赏 花 归 ”。 

比较 类 似 的 回 文 诗 是 明 末 浙江 
才女 吴 颖 雪 写 的 四 首 《 四 时 山水 诗 》, Ba FFRAE el ce Xe, 
春景 诗 由 “ 芍 啼 岸 柳 弄 春 畏 夜 月 明 ” 解 读 为 : 


图 15.2 秦 少 游 的 连环 诗 《 相 思 》 


春景 诗 : 
db vit HE A A ARM , 
柳 弄 春 晴 夜 月 明 。 
明月 夜 晴 春 弄 柳 ， 
WAR A Mi o 


T] EE SERE AEP hy AW ALR”, BRR IE AE MEE O EK DAC ~ 
Ax “ZCI RE RIEU” BL RTT REE 
宋代 李 帅 写 的 夫妻 互 忆 回 文 诗 《 两 相思 》 也 很 有 意思 ， 正 着 读 是 《 思 


FEAR LAK, ERY MIU Fe? 
ae ERI, E TEASE. 
途 路 阻 人 离别 久 ， 讯 音 无 雁 寄 回 迟 。 
孤 灯 夜 守 长 察 舟 ， 夫 忆 妻 今 父 忆 儿 。 
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倒 过 来 读 就 变 成 《 思 夫 诗 》 了 : 
儿 忆 父 今 麦 忆 夫 ， 鼻 察 长 守夜 灯 孤 。 
迟 回 寄 雁 无 音讯 ， 久 别离 人 阻 路 途 。 
诗韵 和 成 难 下 笔 ， 酒 杯 一 酌 怕 空 索 。 
Fors JUL RE, KN ik BARA. 
清 代 诗人 李 易 写 的 诗 《 春 闭 》 则 是 一 首 通 体 回 文 诗 : 
£7 HAG FE, 
谁 系 怀 思 怀 系 谁 ? 
影 弄 花枝 花 弄 影 ， 
H ERIE 
脸 波 横 泪 横 波 脸 ， 
KEREREA s 

在 英文 中 ， 也 有 很 多 回 文 ， 称 为 palindrome。 如 用 来 纪念 美国 前 总 
统 西 奥 多 ' 罗斯福 在 任 内 取得 巴拿马 运河 开 涂 权 的 句子 “A man, a plan, a 
canal-Panama!” 就 是 典型 的 回 文 ， 正 反 都 是 一 个 意思 ”。 

我 们 甚至 在 音乐 作品 中 ， 也 能 见 到 回 文 的 影子 。 如 巴洛克 时 期 著名 的 
德国 作曲 家 、 管 风琴 演奏 家 巴赫 的 作品 《音乐 的 奉献 》( 英语 : The Musical 
Offering ; 德语 :Musikalisches Opfer, BWV 1079 ) 中 的 “Thema Regium”(“ 国 
王 的 主题 " ) 中。 这 首 曲子 源 自 于 巴赫 与 腓 特 烈 二 世 在 1747 年 5 月 7 日 波 
茨 坦 国王 住处 的 一 次 会 面 。 因 为 巴赫 的 作曲 很 有 名 ， 国 王 席 间 便 为 巴赫 提 
供 了 一 段 长 而 复杂 的 音乐 主题 ， 命 他 作 首 三 声 部 赋 格 。 完 成 后 ， 国 王 又 让 
其 作 首 六 声 部 的 。 巴 赫 回 家 两 个 月 后 ， 便 完成 了 国王 的 任务 ， 称 为 《音乐 
的 奉献 》 组 曲 。 其 中 “国王 的 主题 ”很 特别 (图 15.3 )， 它 的 旋律 既 可 以 正 


@ 这 首 英文 回 文句 由 利 . RÆ (Leigh Mercer) 发 表 在 1948 年 11 月 13 H AY Issue of Notes 
& Queries 上 。 
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着 演奏 ， 也 可 以 逆 着 演奏 ， 且 可 以 将 正 的 和 逆 的 做 成 两 个 声 部 同时 演奏 ， 
因此 被 称 为 “镜像 卡农 "。 因 为 这 样 的 旋律 走向 很 像 螃 仍 走 路 ， 也 将 其 称 
为 螃 稻 卡农 ”而 非 回 文 的 命名 。 还 有 人 把 这 种 旋律 看 成 是 一 种 莫 比 乌 斯 带 
上 的 循环 。 据 说 巴赫 业余 时 间 喜 欢 读 与 他 同时 期 , 但 已 声名 大 震 的 数学 家 
莱 布 尼 茨 的 著作 ， 说 不 定 他 这 种 数学 味 很 浓 的 组 曲 的 灵感 来 自 于 莱 布 尼 茨 ， 
因为 后 者 曾 说 过 “音乐 是 数学 在 灵魂 中 无 意识 的 运算 ”。 


Grep FI T te etf eT re eee Pie nde 


图 15.3 《国王 的 主题 》 乐 曲 片段 


所 以 ， 研 究 语言 在 儿童 期 的 学 习 过 程 以 及 与 视觉 、 听 觉 相 关 目 标的 学 
习 次 序 ， 可 能 对 于 我 们 构建 真正 的 智能 体 是 有 启示 性 作用 的 。 我 们 是 否 应 
该 一 开始 就 从 高 层 语义 的 语言 着 手 来 设计 智能 体 ， 还 是 应 该 按 金 字 塔 式 的 
结构 ， 对 视听 觉 及 其 他 感官 系统 的 构建 给 予 更 高 的 优先 级 呢 ? 而 能 否 将 文 
字 游 戏 中 隐藏 的 各 种 奥妙 解 开 ， 也许 是 真正 理解 语言 的 途径 之 一 。 

如 果 不 看 、 不 听 、 不 摸 、 不 说 ,智能 体 还 能 学 习 吗 ?请 听 下 回 ! 


QD eK RAMEE: https://v.qq.com/x/page/10616bmt8hk html 
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=@ 庄 周 梦 蝶 与 梦境 学 习 


凌晨 一 点 多 ， 又 度 过 了 节奏 明快 、 高 强度 工作 的 一 天 。 
熄灭 灯 ， 安 静 地 躺 到 床上 ， 闭 上 眼睛 ， 调 整 下 呼吸 。 没 几 分 
钟 ， 一 阵 熟 悉 的 感觉 天 来， 身体 开始 向 大 脑 发 出 睡眠 的 信息 。 
那 感 觉 ， 就 像 是 舞台 上 的 灯光 在 谢幕 后 一 排 一 排 地 依次 关闭 ， 
躯体 表层 的 感官 细胞 似乎 也 如 潮水 退去 般 逐 层 在 “停止 ”它们 
的 功能 。 很 快 , 与 床 热 的 接触 感 消失 了 ,身体 的 沉重 感 无 踪 了 ， 
随 之 而 来 的 是 下 哈 感 ， 身 体 一 直 往 下 险 。 好 在 不 会 像 第 一 次 
出 现时 那么 惊慌 失措 ， 我 甚至 有 些 享受 这 种 急速 下 险 的 感觉 ， 
因为 我 已 经 能 在 下 险 时 控制 身体 的 姿态 。 我 也 知道 再 坚持 一 

会 儿 ， 就 会 旋转 着 穿越 一 条 长 长 的 、 漆 黑 的 隧道 ， 路 入 繁星 

点 点 的 天 空 ， 自由、 缓慢 地 飞行 了 。 

这 是 我 偶尔 能 在 快要 入 睡 时 ， 零 距离 观察 自己 做 梦 的 体验 。 对 于 梦 呢 ， 
历史 上 有 各 种 各 样 的 诠释 。 早 期 文明 认为 梦 是 人 类 能 进入 另 一 个 真实 的 物 
理 世 界 的 唯一 通道 。 现 代理 论 则 一 直 在 争论 做 梦 的 意义 ， 有 认为 其 只 是 生 
理 机 制 ， 也 有 认为 它 是 心理 必需 ,或 是 两 者 的 组 合 。 著 名 的 奥地利 心理 学 
家 西 格 蒙 德 . 弗 阁 伊 德 对 自己 的 梦 进 行 过 近 两 年 的 自我 分 析 ， 从 压抑 和 性 
的 角度 出 发 ， 于 1900 年 出 版 了 经 典 名 著 《 梦 的 解析 》 踢 。 曾 与 他 合作 后 又 
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分 道 扬 镀 的 瑞士 心理 学 家 卡尔 古 斯 塔 夫 : 荣 格 在 其 自传 《 荣 格 自传 : 回忆 、 
梦 与 省 思 》 中 也 对 梦 给 予 了 不 同 视角 的 分 析 外 。 中 国 古代 也 有 一 本 居家 旅 
行 必 备 、 民 间 流 传 甚 广 、 靠 梦 来 下 吉凶 的 《周公 解梦 》 而 汉语 成 语 对 梦 有 
更 简洁 的 解释 :“ 日 有 所 思 ， 夜 有 所 梦 ”"。 梦 在 《 周 礼 * 春 官 》 中 还 被 分 成 
了 6 种 类 型 : 正 梦 、 概 梦 、 思 梦 、 寝 梦 、 喜 梦 和 惧 梦 。 多 数 书 中 对 梦 的 分 
析 集 中 在 精神 层面 、 因 果 分 析 或 心理 治疗 上 。 但 是 , 睡眠 与 梦 对 智能 体 的 
学 习 有 何 作用 或 启示 呢 ? 


睡眠 周期 

睡眠 对 智能 体 来 说 ， 是 必 不 可 少 的 休息 方式 。 在 睡眠 期 间 ， 智 能 体会 
降低 对 外 界 刺激 的 反应 和 与 周边 环境 的 交互 ， 相 对 抑制 感知 系统 的 活动 以 
及 所 有 随意 肌 (voluntary muscle) 的 活动 ， 利 用 这 段 时 间 对 全 身 各 种 系统 
进行 保养 调整 。 由 于 不 用 进行 剧烈 运动 ， 能 耗 的 需求 也 降低 了 。 但 能 耗 并 
非 没 有 ， 如 8 小 时 睡眠 后 人 的 体重 可 能 减轻 300~400g 甚至 更 多 ， 所 以 ， 充 
分 睡眠 是 有 助 于 减肥 的 。 

智能 体 在 睡眠 时 的 活动 ， 没 有 日 常生 活 时 激烈 ,但 也 不 像 昏 迷 或 其 他 
有 意识 障碍 方面 的 疾病 那么 缺乏 活力 。 根 据 眼 动 的 频率 ， 睡 眠 可 以 区 分 成 
非 快 速 眼 动 相 睡眠 (non-rapid eye movement，NREM ) 和 快速 眼 动 相 睡眠 
(rapid eye movement, REM ) 两 个 明显 不 同 的 模式 。 据 说 NREM 能 改进 记 
忆 能 力 ， 而 REM 则 可 以 增强 创新 性 的 问题 求解 能 力 。 正 常情 况 下 ， 成 年 
人 会 先进 入 NREM， 再 转 到 REM, 平均 下 来 ， 两 者 相 加 的 时 间 约 90 分 钟 。 
再 重复 这 一 睡眠 周期 ， 一 次 良好 的 睡眠 有 4-6 个 周期 。 关 于 NREM， 美 国 
睡眠 医药 协会 还 将 其 细 分 成 3 个 小 的 阶段 ， 因 此 一 个 睡眠 周期 包括 5 个 阶 
Bt, NI > N2— N3 > N2 — REMP?, HP N3 被 称 为 Delta 睡眠 或 慢 波 
( slow-wave ) 睡眠 ， 而 在 自然 醒 阶 段 REM 的 比例 会 增加 。 前 4 个 阶段 的 次 
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序 有 时 会 出 现 变 化 。 但 如 果 先 出 现 REM， 再 有 NREM， 那 可 能 就 是 身体 过 
于 疲劳 了 。 

值得 一 提 的 是 ， 虽 然 大 部 分 的 梦 发 生 在 REM 阶段 中， 近年 来 的 研究 
表明 ， 梦 也 会 在 其 他 阶段 发 生 ， 只 是 频率 要 低 得 多 。 梦 境 多 是 以 第 一 人 称 
的 形式 出 现 ， 并 会 华 有 各 种 “感觉 "， 如 视觉 和 移动 。 好 在 正常 的 睡眠 有 其 
保护 机 制 ， 它 会 将 身体 的 运动 功能 瘫痪 掉 ， 并 在 大 脑 醒 来 前 恢复 。 这 样 你 就 
可 以 安全 地 在 梦 中 游 走 、 跑 酷 、 练 降 龙 十 八 掌 ， 也 不 用 担心 把 枕 边 人 踢 到 床 
下 面 去 了 。 不 过 ,也 存在 小 概率 的 情况 ， 即 在 做 这 类 梦 时 运动 功能 恢复 了 。 

目前 关于 做 梦 主 要 理论 之 一 是 约翰 . 艾 伦 ' A i AE (John Allan 
Hobson ) 和 罗伯特 ' ZFF) ( Robert McCarley ) 在 1977 年 提出 的 激活 - 合 
成 假想 (activation-synthesis hypothesis ) 理论 57. (ZHU Jy ETE REM 
阶段 ， 由 大 脑 皮质 中 神经 元 的 随机 触发 引起 ， 然 后 前 脑 再 创建 一 个 故事 来 
将 这 些 无 意义 、 荒 雇 的 传 感 信息 融合 并 使 之 有 意义 。 这 一 理论 解释 了 许多 
梦 的 古怪 本 质 ， 但 也 只 能 解释 梦 的 部 分 现象 。 据 不 完全 统计 ， 人 的 一 生平 
均 有 6 年 的 时 间 会 用 来 做 梦 。 那 是 否 可 以 利用 做 梦 来 帮助 智能 体 改善 学 习 
效率 呢 ? 还 是 像 民 国 女 作家 萧红 建议 的 ,“ 生 前 何必 久 睡 ， 死 后 自 会 长 眠 ”， 
把 睡眠 时 间 缩 短 些 呢 ? 


梦境 学 习 

假设 梦 除 了 休息 、 帮 助 我 们 调适 情绪 、 抒 发 内 在 的 心情 和 担忧 的 功能 
外 ， 还 是 一 种 学 习 方 式 ， 那 么 它 和 我 们 人 工 智 能 中 常见 的 学 习 模 式 有 何 区 
别 呢 ? 

粗略 来 说 ， 涉 及 学 习 的 人 工 智能 方法 主要 有 两 种 ， 一 种 称 为 监督 学 
习 (supervised learning )， 也 称 为 有 教师 学 习 ， 另 一 种 称 为 无 监督 学 习 
(unsupervised learning ) 或 无 教师 学 习 ， 俗 称 自学 成 材 。 监 督学 习 的 特点 
是 学 习 的 时 候 ， 每 给 一 个 样本 ， 就 会 赠送 个 标签 。 比 如 人 脸 识 别 中 ， 张 三 
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就 是 张 三 图 像 的 标签 。 如 果 给 10 个 人 的 10 张 人 脸 加 上 各 自 的 标签 ， 就 有 
100 张 有 标签 的 人 脸 图 像 。 这 些 图 像 可 以 构成 一 组 训练 集 ， 帮 助 训 练 一 个 
人 脸 识别 的 模型 ， 使 之 能 对 未 知 的 人 脸 图 像 有 好 的 识别 性 能 。 训 练 集 的 多 
少 往往 决定 了 识别 性 能 的 优 劣 。 比 如 目前 已 经 在 国内 的 很 多 高 铁 站 、 机 场 
设置 的 人 脸 识别 或 认证 系统 ， 其 性 能 稳定 和 优异 的 原因 之 一 是 训练 集 里 的 
样本 规模 非常 大 。 而 另 一 种 学 习 方式 ， 非 监督 学 习 ， 则 无 须 标签 输入 。 它 
主要 是 根据 样本 集合 中 的 某 种 结构 或 相似 关系 来 将 样本 聚 成 多 个 类 别 。 比 
如 图 16.1 所 示 、 格 式 塔 心理 学 中 提 到 的 根据 (黑白 ) uit ae e BE OK FH 2j] 


聚 类 ， 就 是 人 或 智能 体 的 一 种 无 监督 学 习 模 式 。 
人 OOO OO OO: OO 
eeee @ OOO OO OO OO 
O OOOO OOO O'O OO OO 
@eeee @ QOO OO OO OO 
QOO 'O O0 COO OO OO OO 
e@eeee @ OOO OO OO Oo 
(a) (b) 
图 16.1 无 监督 学 习 
(a) 自动 根据 黑白 程度 聚 类 ; (b) RRB ARK 


除 此 以 外 ， 介 于 监督 和 无 监督 之 间 的 为 弱 监 督学 习 。 举 例 来 说 ， 我 们 
手机 拍照 后 会 留 下 大 量 的 照片 ， 这 些 照片 很 少 会 贴 上 标签 或 说 明 。 类 似 的 ， 
在 互联 网 上 也 存在 大 量 的 未 标注 样本 。 但 这 些 样 本 之 间 存 在 某 种 结构 关系 。 
在 不 依赖 人 力 对 样本 进行 过 多 标注 ， 结 合 这 些 未 标注 样本 的 信息 和 少量 有 
标签 样本 一 起 来 训练 预测 模型 的 方式 ， 就 是 弱 监 督 中 的 一 种 ， 即 半 监 督学 
习 。 还 有 基于 这 3 种 模式 衍生 出 来 的 其 他 学 习 方 法 ， 但 大 同 小 异 。 

与 人 工 智能 常见 的 这 些 学 习 方法 相 比 ， 梦 有 以 下 4 个 不 同 的 特点 。 

第 一 ， 学 习 是 需要 样本 或 特征 输入 的 。 但 是 ， 按 激活 - 合成 假想 理论 ， 
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梦境 中 输入 的 特征 随意 性 比较 大 。 而 且 ， 从 大 多 数 报道 的 情况 来 看 ， 梦 境 
中 的 视觉 图 案 模 糊 ， 不 如 真实 视觉 系统 获得 的 细腻 。 不 仅 如 此 ， 做 梦 也 常 
出 现在 睡眠 的 稍 后 部 分 。 所 以 ， 塌 川 (Horikawa) 等 在 研究 时 ， 为 了 节省 
实验 的 时 间 ， 曾 试图 在 测试 者 睡眠 刚 开 始 而 不 是 深度 睡 眼 时 ， 通 过 叫 醒 并 
记录 对 梦境 的 文字 回忆 来 重建 视觉 信息 中。 但 这 仍 是 一 种 间接 方式 ， 真 正 
的 图 像 还 很 难 直接 从 人 脑 中 提取 出 来 。 另 外 ， 梦 在 多 数 情况 下 是 灰 度 的 ， 
没有 颜色 。 当 然 有 些 艺 术 天 赋 好 的 ， 偶 尔 也 会 梦 到 彩色 ， 甚 至 很 精细 的 彩 

色 图 像 。 值 得 指出 的 是 除了 视觉 外 ， 其 他 “感官 ”系统 如 大 脑 里 的 “嗅觉 ” 

参与 梦 的 构成 。 

p 梦 是 很 少 重复 且 容 易 被 忘记 。 据 说 醒 来 5 分 钟 后 ， 我 们 会 忘掉 
50% 梦 的 内 容 。10 分 钟 后 ，90% 的 内 容 会 忘掉 。 可 能 的 原因 是 : 中 梦 中 的 
影像 并 不 强烈 、 模 糊 ， 缺 乏 细节 描述 ; @ 与 常规 的 学 习 模式 不 同 ， 梦 也 没 
有 传统 学 习 中 常见 的 关联 和 重复 性 。 所 以 ， 不 像 白天 的 行动 那么 不 容易 忘 
记 ， 这 使 得 梦 很 少 被 认为 是 一 种 潜在 有 效 的 学 习 方法 。 

第 三 ， 梦 有 助 于 创新 性 成 果 的 产 出 。 一 个 广 为 流 传 的 传说 是 ， 德 国 化 
学 家 凯 库 勒 (Kekule) 曾 在 梦 中 看 到 旋转 的 碳 原子 ， 其 长 链 像 蛇 一 样 ， 头 
尾 相 连 成 圆 图。 因此 他 悟 出 了 葵 环 的 环 状 结构 ， 形 成 了 世界 有 机 化 学 界 最 
艇 动 的 成 果 之 一 。 很 多 音乐 家 如 贝多 芬 据说 也 能 在 梦 中 寻找 到 灵感 。 不 过 
因为 梦 里 的 故事 都 只 能 由 当事人 来 表述 ， 所 以 很 难 获得 客观 性 的 实证 ， 包 
括 凯 库 勒 的 故事 也 有 不 少 置疑 的 声音 。 

第 四 ， 梦 不 是 特定 任务 的 学 习 ， 每 个 梦 的 故事 线 都 不 同 ， 且 具有 时 间 
的 连续 性 。 需 要 注意 的 是 ， 这 一 故事 线 不 管 是 贴近 现实 还 是 异常 奇幻 ， 都 
与 做 梦 的 主体 曾经 有 过 的 经 历 相 关 。 比 如 没 坐 过 火箭 ， 人 就 不 可 能 有 与 火 
箭 轰 乘 感 一 致 的 真实 体验 。 

显然 ， 直 接 利用 平时 的 梦 来 促进 学 习 的 难度 是 很 大 ， 但 并 非 说 完全 用 
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不 了 。 举 例 来 说 ， 霍 布 森 (Hobson, 2009) 的 研究 认为 REM 睡眠 与 体能 
相关 技能 的 学 习 相 关 ， 而 与 死记 硬 背 之 类 的 记忆 关系 较 小 四。 对 这 种 相关 
性 , 他 们 从 “婴儿 和 幼儿 较 成 人 有 更 多 的 REM 睡眠 ”获得 了 事实 上 的 支持 。 

不 仅 如 此 ， 国 外 还 有 研究 团体 专门 研究 如 何 让 梦 参 与 学 习 。 粗 略 来 说 ， 
可 以 分 成 三 类 。 一 种 是 提高 梦 的 召回 率 ， 即 把 梦境 里 的 内 容 尽 可 能 记 下 来 ， 
属于 被 动 式 学 习 。 其 方式 也 相对 简单 粗暴 。 比 如 在 睡 前 ， 暗 示 自 己 要 记 住 
自己 的 梦 ; 或 者 把 笔 和 纸 或 手机 放 床 边 ， 方 便 随 时 醒 来 记 下 ; 或 者 试 着 慢 慢 
地 醒 来 以 维持 在 最 后 一 个 梦 的 情绪 里 ; 或 者 多 喝 点 水 以 确保 半夜 能 从 梦 中 
醒 来 。 

第 二 种 为 主动 式 梦境 学 习 。 与 平时 的 做 梦 方 式 不 同 ， 这 是 一 种 特定 的 
做 梦 形式 ， 叫 清晰 梦境 (lucid dreaming) 吧 。 直 观 来 说 ， 做 梦 的 人 能 意识 
到 他 在 做 梦 ， 他 能 控制 梦 中 人 的 姿态 、 梦 境 的 叙事 方式 和 环境 。 比 如 多 数 
与 飞行 相关 的 梦 都 是 清晰 梦境 的 结果 。 研 究 表明 ， 这 种 梦境 有 可 能 帮助 智 
能 体 学 习 。 据 估计 ， 在 美国 只 有 不 到 10 万 的 人 能 有 清晰 梦境 的 能 力 四 。 

清晰 梦境 的 研究 最 早 可 以 追溯 到 1959 年 法兰克福 大 学 希望 发 展 一 
套 有 效 的 技术 来 诱导 梦境 。 到 1989 年 ， 德 国 梦 研 究 家 保罗 FEF (Paul 
Tholey ) 提出 了 反射 技术 (reflection )， 并 成 功 诱导 。 该 技术 的 不 足 是 ， 整 
天 都 得 询问 自己 是 醒 着 还 是 睡 着 了 Um. 

随后 ， 斯 坦 福 大 学 清晰 研究 院 ( Lucidity Institute) 的 史蒂芬 . 拉 伯 格 
( Stephen LaBerge ) 和 琳 恩 . 莱 维 坦 (Lynne Levitan ) 等 学 者 也 就 此 进行 了 
广泛 的 研究 。 他 们 提出 的 “现实 测试 ”( reality testing ) 和 “清晰 梦境 的 记 
忆 诱 导 ”( mnemonic induction of lucid dreams, MILD ) 目前 是 清晰 梦境 研 
究 领域 最 成 功 的 技术 之 一 中。 不 像 反 射 技术 ，MILD 只 需 在 晚上 进行 提醒 。 
它 要 求实 验 者 睡觉 前 需 暗 示 自 己 记 住 梦 ， 然 后 集中 注意 力 识 别 什 么 时 候 在 
做 梦 以 及 记 住 它 确实 是 梦 。 然 后 再 沉思 重新 进入 最 近 的 一 个 梦 ， 并 思考 它 
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确实 是 梦 的 一 些 线索 。 同 时 ， 还 可 以 想象 在 梦 里 将 会 做 什么 。 最 后 ， 不 断 
重复 “识别 什么 时 候 在 做 梦 ” 和 “重新 进入 一 个 梦 ” 的 步骤 , 直到 睡 着 为 止 。 

另 一 种 主动 式 梦 境 学 习 是 梦境 有 旷 化 (dream incubation )， 即 学 会 在 某 个 
要 发 生 的 特定 梦境 主题 里 种 下 一 颗 种 子 外。 比如 反复 暗示 自己 要 做 一 个 关 
于 化 学 实验 的 梦 。 那 些 相信 能 通过 梦境 来 求解 问题 的 人 ， 可 以 利用 这 一 技 
术 来 诱导 梦境 到 特定 的 主题 。 与 清晰 梦境 的 主要 区 别 在 于 ， 梦 境 孵 化 将 注 
意 力 集中 到 了 更 特定 的 问题 上 。 

基于 以 上 的 讨论 ， 可 以 推测 ， 除 了 和 常 在 心理 学 和 生理 学 中 讨论 的 功能 
如 发 展 个 性 、 增 强 自信 、 克 服 亚 梦 、 改 善 大 脑 健 康 外 ， 梦 境 学 习 可 能 有 助 
于 形成 创新 性 的 问题 求解 。 如 果 条 件 成 熟 , 清晰 梦境 甚至 可 能 变 成 一 种 “ 世 
界 的 模拟 器 ”或 “大 脑 中 的 平行 世界 "。 它 允许 人 类 在 更 安全 的 环境 下 学 习 
各 种 技能 ， 学 习 生 活 在 可 以 想象 的 任意 世界 ， 经 历 和 选择 各 种 可 能 的 未 来 。 
不 仅 如 此 ,史蒂芬 . 拉 伯 格 还 尝试 过 用 眼 动 来 辅助 ， 让 做 梦 的 人 与 观察 员 
实现 梦 中 交流 ， 尽 管 这 种 交流 还 十 分 有 限 。 

另外， 梦境 中 的 学 习 效 率 可 能 比 我 们 以 为 的 要 高 ， 其 原因 是 睡眠 状态 
中 的 时 间 是 主观 而 非 客 观 的 。 比 如 唐 代 《 枕 中 记 》 卢 生 的 “ 黄 梁 一 梦 ” 竞 
然 在 一 顿 饭 的 睡眠 时 间 里 ， 享 尽 了 一 生 的 荣华 富贵 。 虽 然 是 小 说 里 的 夸张 
手法 ,但 或 多 或 少 也 表明 了 ， 人 们 主观 感觉 到 的 梦境 时 间 要 比 客观 时 间 长 。 
因此 ， 利 用 可 以 做 梦 的 6 年 时 间 进 行 高 效 学 习 也 不 是 不 可 能 。 

在 未 来 星际 旅行 中 ， 睡 眠 中 学 习 说 不 定 也 能 起 重要 作用 。 就 我 所 知 ， 
现在 还 没有 哪 部 科幻 片 和 科幻 小 说 讨论 过 如 何 充分 利用 睡眠 和 做 梦 机 制 来 
帮助 学 习 的 。 

庄 周 梦 蝶 与 缸 中 之 脑 


我 相信 每 个 人 都 会 做 梦 ， 不 管 是 否 能 够 记 住 ， 都 会 有 错 把 梦 当 成 现实 
的 时 候 或 者 “ 醒 来 后 ”发 现实 际 还 在 梦 里 的 经 历 。 
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关于 梦 的 这 种 错觉 ， 古 今 中 外 都 曾 有 过 一 些 很 有 意思 的 哲学 层面 的 思 
考 。 举 例 来 说 ， 战 国 时 期 的 道家 代表 人 物 庄 周 在 其 作品 《庄子 * 齐 物 论 》 
中 曾 有 一 段 描述 : 

SALAS AMR, MMR, Ewes, FAL. RA, 
则 六 莲 然 周 也 。 不 知 周 之 梦 为 糊 蝶 与 ， 蝴 蝶 之 梦 为 周 与 ? 周 与 蝴蝶 ， 则 必 
BPR. MLB, 

这 段 故 事 谈 到 了 庄 周 梦 见 自己 变 成 了 蝴蝶 ， 以 至 于 在 梦 中 不 记得 自己 
是 庄 周 ， 直 到 醒 来 后 才 方 知 自己 是 庄 周 ( 图 16.2 )。 于 是 ， 他 产生 了 一 个 困 
惑 ， 究 竟 自 己 是 庄 周 梦 见 的 蝴蝶 ， 抑 或 是 蝴蝶 梦 见 的 庄 周 呢 ? 

古代 讲述 这 种 疑问 的 故事 在 世界 上 有 多 个 版 本 ， 如 印度 教 的 玛雅 错觉 
( Hindu Maya illusion )， 柏 拉 图 的 山洞 富 言 (Plato’s allegory of the cave ) 以 
及 1641 年 笛 卡 儿 在 《第 一 哲学 沉思 录 》 中 掺 想 的 邪恶 恶魔 ( evil demon )。 

在 当代 ， 美 国 著名 哲学 家 希拉 里 ， 普 特 南 在 其 1981 年 著作 《理性 ， 真 
HASE ) PRE YP (brain ina vat) 的 问题 中 (图 16.3 ) : 

假定 某 人 ( 比如 你 自己 ) 被 那 恶 科学 家 实施 了 手术 ， 大 脑 被 剥离 出 来 


图 16.2 庄 周 梦 蝶 ( 选 自明 代 陆 治 图 16.3 第 中 之 脑 
(HERE) EO 
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并 与 身体 分 离 ， 放 在 图 16.3 中 的 培养 液 中 ， 然 而 利用 先进 技术 将 大 脑 的 神 
经 末梢 连接 至 计算 机 上 。 计 算 机 会 根据 预 设 的 程序 向 大 脑 发送 它 需要 的 各 
种 信息 ， 使 大 脑 产生 一 切 都 正常 的 幻觉 。 这 种 情况 ， 对 你 来 说 ， 一 切 都 和 
平时 无 异 。 你 喜欢 的 人 、 事 、 物 ， 你 爱 的 运动 、 身 体感 觉 都 通过 计算 机 来 
百 分 百 台 真 的 还 原 ， 偶 尔 还 会 给 点 大 脑 之 前 保存 的 记忆 ， 让 你 有 怀旧 的 感 
觉 。 也 可 以 通过 计算 机 模拟 复杂 场景 , 让 你 产生 参加 鸡尾酒 会 . 和 朋友 交谈 、 
开怀 畅饮 的 幻觉 。 

在 这 个 情形 下 ， 你 如 何 确保 你 自己 不 是 在 这 种 困境 之 中 呢 ? 

事实 上 ， 有 不 少 影视 作品 与 这 一 哲学 问题 相关 。 如 1999 年 开始 上 映 的 
《黑客 帝国 》 系 列 电影 ， 剧 情 里 “正常 的 现实 世界 ”实际 上 是 由 “和 矩阵 ”的 
计算 机 人 工 智 能 系统 控制 着 。 再 如 2010 年 克里斯托弗 诺 兰 的 电影 《 资 梦 
空间 》 即使 到 了 剧 终 , 那 旋转 的 陀螺 还 是 让 人 猜 不 透 是 在 现实 中 还 是 梦 里 。 
2018 年 1 月 上 映 的 电影 《移动 迷宫 3 : 死亡 解 药 》 中 ， 米 诺 被 WCKD 邪恶 
组 织 控 制 着 ， 连 着 外 部 计算 机 的 大 脑 就 像 氏 中 之 脑 一 样 ， 使 他 长 时 间 活 在 
恐怖 幻觉 之 中 ， 饱 受精 神 折磨 。 在 2018 年 3 月 上 映 的 电影 《升级 》 里 ， 人 
工 智能 芯片 被 移植 到 男 主角 身上 后 ， 成 功 地 将 男 主 角 的 大 脑 思 维 困 在 “ 饶 
中 之 脑 ” 中 ， 给 其 营造 了 一 个 虚幻 的 世界 ， 而 真正 的 躯体 则 被 人 工 智能 芯 
片 接管 了 。 

在 这 些 假 设 中 ， 之 前 提 及 的 笛 卡 儿 的 名 言 “ 我 思 故 我 在 ”似乎 已 不 是 那 
么 明显 的 成 立 。 因 为 氏 中 之 脑 也 能 “思考 "， 但 它 的 “自我 ” 认 知 却 可 能 是 
被 人 为 加 到 大 脑 上 诱发 的 错觉 。 结 果 ， 这 一 哲学 问题 长 期 困扰 了 很 多 对 人 
工 智能 及 相关 领域 感 兴趣 的 研究 人 员 。 甚 至 刚 去 世 不 久 的 物理 学 家 霍金 也 
曾 于 2016 年 4 月 在 媒体 上 表示 过 “在 区 分 梦 和 现实 上 ， 人 类 还 无 能 为 力 ， 
只 有 等 我 们 能 真正 了 解 意识 和 宇宙 后 ， 才 有 可 能 ”( 原文 : But we humans 


just don’t and perhaps can’t know if we are living in our dreams or reality, at least 
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not until we start to understand more about consciousness and the universe )。 

如 果 目 前 的 能 力 还 无 法 做 到 有 效 区 分 ， 那 么 抛 开 哲 学 问题 不 提 ， 我们 
应 该 可 以 通过 梦境 实现 与 现实 相等 价 的 学 习 。 我 们 也 可 以 利用 这 种 不 可 区 
分 性 ， 在 未 来 战争 中 形成 新 型 攻击 模式 ， 即 对 敌人 实施 “和 缸 中 之 脑 ” 式 的 
攻击 ， 比 如 让 其 为 攻击 方 服 务 而 不 自 知 。 

不 管 何 种 攻击 ， 都 源 自 大 脑 在 神经 和 认 知 方面 的 错觉 。 那 实际 生活 中 ， 
认 知 存在 错觉 吗 ? 
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公元 前 245 年 ， 古 希腊 叙 拉 古城 的 赫 农 王 命 令 工匠 制作 一 项 纯 金 的 王 
冠 。 工 匠 完 工 后 ， 国 王 感觉 不 放心 ， 对 着 重量 没 变 的 王冠 左 看 看 、 右 看 看 ， 
总 怀疑 工匠 把 里 面 的 金子 换 成 其 他 材料 了 。 可 是 ， 没 证 据 又 不 好 明说 。 跟 
大 臣 们 说 起 此 事 ， 他 们 也 只 能 面 面 相 凯 。 后 经 过 一 个 大 臣 的 建议 ， 国 王 请 
来 了 当时 最 有 名 的 数学 家 阿 基 米 德 帮助 鉴定 。 阿 基 米 德 看 了 半天 ， 也 不 清 
楚 要 怎么 测 。 又 冥 思 若 想 了 多 日 ， 毫 无 头绪 ， 便 想 泡 个 澡 舒 组 下 心情 。 路 
进 装 满 水 的 浴盆 后 ， 他 发 现 水 的 涨 落 似乎 和 他 的 站 起 坐 下 有 关 ， 而 且 坐 下 
时 还 能 感受 到 水 向 上 对 身体 的 托 力 ， 身 体 也 随 之 变 轻 了 。 他 懂 然 大 悟 ， 原 
来 可 以 用 测量 固体 在 水 中 排水 量 的 办 法 ， 来 检测 物体 的 体积 。 那 也 就 能 根 
据 制 作 王 冠 材料 的 密度 与 体积 之 间 的 关系 ， 来 推测 王冠 是 否 造假 了 。 

一 瞬间 他 种 然 开朗 ， 跳 出 了 澡 盆 ， 连 衣服 都 忘记 穿 了 ， 一 路 大 声 喊 着 
“ 尤 里 卡 ! 尤 里 卡 ”( Eureka， 和 希腊 语 : sopnmka， 意 思 是 我 知道 了 )。 阿 基 米 
德 由 此 破解 了 王冠 称 重 的 难题 ， 发 现 工匠 欺骗 了 国王 。 更 重要 的 是 ， 他 因 
此 发 现 了 浮力 定律 ， 即 物体 在 液体 中 得 到 的 浮力 ， 等 于 物体 排出 液体 的 重 
量 (图 17.1)。 
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图 17.1 阿 基 米 德 与 浮力 定律 外 


科学 发 现 靠 什么 呢 ? 有 不 少 重大 的 发 现 靠 的 是 灵光 一 内 ， 如 阿 基 米 
德 洗澡 时 想到 的 浮力 定律 或 阿 基 米 德 定律 ， 俄 国 化 学 家 门 捷 列 夫 玩 扑克 牌 
时 发 现 的 元 素 周 期 表 。 这 种 感觉 可 以 用 宋朝 夏 元 易 《 绝 句 》 中 的 “踏破 铁 
鞋 无 更 处 ， 得 来 全 不 费 工 夫 ” 来 形容 。 国 人 管 灵 光一 内 叫 “ 顿 悟 ”， 西 方 
则 把 它 称 之 为 Eureka effect ( 尤 里 卡 效应 ， 或 称 为 Aha moment 和 Eureka 
moment ) P”, 

GAA ZY. KARER EL PA BRS ELE AS [e], BER ER UL AEST 
识 的 反映 ， 但 相对 神秘 。 目 前 在 学 术 界 ， 关 于 顿悟 的 发 生 仍然 争论 不 休 。 
其 在 脑 区 发 生 的 精确 位 置 未 知 ， 而 且 在 何 种 环境 下 能 发 生 也 未 知 。 所 以 ， 
阿 基 米 德 只 好 泡 澡 来 启发 思考 ， 而 量子 电动 力学 的 创始 人 之 一 费 恩 曼 则 爱 
在 泡 酒 吧 的 同时 顺便 做 研究 。 

从 文献 的 总 结 来 看 ， 顿 悟 这 种 思维 方式 包括 两 个 部 分 : 首先 是 在 某 一 
问题 上 已 经 进行 了 长 时 间 的 思考 , 但 陷入 了 困境 。 尽 管 尝试 了 能 想到 的 各 
种 可 能 性 ， 仍 不 得 其 门 而 和 人。 突然 某 一 天 在 某 地 ， 令 人 意 想不到 的 就 有 了 
灵感 ， 并 快速 找到 了 问题 的 答案 。 而 且 ， 该 灵感 不 必 依 赖 原 来 已 经 僵化 的 
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解 题 逻 辑 或 结构 ， 甚 至 需要 “跳出 三 界外 "， 才 有 可 能 获得 。 

一 般 认 为 ， 它 有 4 个 特点 : QD 它 是 突然 出 现 的 ; @ 对 该 问题 的 求解 是 流 
Wa. REI; @) 通 常 有 正面 效应 ; 由 经 历 顿悟 的 人 相信 它 的 解 是 真实 和 正确 
的 。 这 4 个 特点 往往 需要 组 合 在 一 起 才能 见效 ， 如 果 分 开 了 就 很 难 获得 灵 
eats OY. 

尽管 关于 灵感 仍 无 合理 的 解释 ， 但 可 以 推测 它 的 形成 机 制 不 是 突然 任 
空 在 大 脑 中 加 速 形成 的 ， 应 该 与 人 类 已 经 学 习 好 的 某 些 结构 具有 关联 性 。 
那么 ， 它 和 我 们 哪 种 思维 方式 比较 相似 呢 ?7 如 果 能 找到 其 中 的 关联 ， 也 许 
我 们 就 能 设计 具有 类 似 创造 能 力 的 人 工 智能 体 。 

我 们 不 妨 了 解 一 下 人 类 认 知 中 普遍 采用 的 两 种 思维 方式 : 快 思维 和 慢 
思维 ,以 及 快 思维 中 存在 的 直觉 统计 错觉 P0, 

认 知 错觉 

人 类 经 历 了 长 时 间 的 演化 ， 发 明了 语言 、 制 造 了 工具 、 建立 了 几 近 完 
备 的 数学 理论 体系 ， 并 通过 其 他 智能 体 不 可 能 具备 的 、 长 时 间 的 学 习 来 帮 
助 提高 知识 水 平 。 然 而 ， 很 多 高 阶 能 力 并 不 见得 会 在 日 常生 活 中 起 主导 作 
用 。 比 如 ,我 们 虽然 会 在 大 学 学 习 微 积分 ， 但 绝 大 多 数 情 况 下 ， 我 们 只 需 
要 知道 用 电子 表格 填 下 数字 就 行 了 。 甚 至 在 需要 绩 密 计 算 时 ， 有 时 候 人 类 
还 是 会 凭 自己 的 经 验 或 直觉 来 优先 进行 判断 。 

举 个 极端 情况 的 例子 ， 为 什么 在 股市 中 专家 的 建议 经 常 不 怎么 管用 
WE? 实际 上 , 多 数 专家 在 做 分 析 时 , 都 是 按 《 经 济 学 原理 》 来 指导 和 建议 的 ， 
目的 是 对 投资 组 合 进行 利益 最 大 化 。 总 不 能 说 经 过 了 千 锤 百 炼 的 经 济 学 原 
理 有 严重 不 足 吧 ， 可 为 什么 股民 很 多 还 是 很 容易 被 制 韭菜 呢 ? 因 为 实际 上 
偏好 理性 决策 或 慢 思维 的 人 并 不 多 ， 尤 其 在 股市 瞬息 万 变 的 时 候 ， 能 做 深 
层次 思考 、 计 算 的 机 会 更 少 ， 股 民 往往 会 赁 自己 的 直觉 或 快 思维 来 做 快速 
决策 。 可 是 ， 这 些 决 策 很 多 时 候 是 远离 了 专家 建议 的 最 优 决策 。 
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美国 普林斯顿 大 学 的 心理 学 教授 卡 纳 曼 和 其 前 同事 特 沃 斯 基 对 人 的 两 
种 思维 方式 进行 了 深入 研究 。 他 们 从 直 党 统计 学 (intuitive statistics ) 的 角 
度 出 发 ， 发 现 了 一 系列 有 趣 的 现象 ， 于 1974 年 在 《科学 》( Science ) 上 发 
表 了 一 篇 社会 学 领域 引用 最 高 的 关于 不 确定 性 判断 的 论文 时， 后 进一步 形 
成 了 展望 理论 (prospect theory， 也 有 称 前 景 理论 ) 外， 并 且 卡 纳 曼 因为 这 
些 成 果 于 2002 年 获得 诺 贝 尔 经 济 学 奖 ”。 尽管 获得 的 是 经 济 学 奖 , 但 其 理论 
体系 详细 地 阐述 了 智能 体 存在 的 认 知 误区 。 

他 们 发 现 人 在 做 很 多 复杂 任务 判断 时 ， 并 不 会 用 绩 密 的 思维 去 计算 每 
个 事件 的 概率 ， 反 而 会 借助 于 少量 的 启发 式 技巧 来 做 更 为 简单 、 快 速 的 判 
断 。 这 些 判 断 策略 在 绝 大 多 数 情 况 下 是 有 效 的 ,不然 人 很 快 就 会 在 自然 进 
化 中 被 淘汰 。 但 是 ， 这 种 判断 策略 有 时 会 导致 严重 和 系统 性 的 错误 ， 而 人 
类 却 不 见得 会 意识 到 ， 即 使 是 受过 训练 的 专家 也 是 如 此 。 

比如 我 们 在 判定 物理 量 如 距离 和 大 小 时 ， 常 通过 启发 式 的 规则 来 做 主 
观 的 概率 评估 。 看 得 越 清楚 的 物品 通常 会 被 认为 距离 更 近 ， 反 之 更 远 。 虽 
然 这 种 规则 在 一 定 情况 下 是 有 效 的 , 但 也 可 能 会 带 来 系统 性 误差 。 如 在 “ 立 
所 ”后 ， 就 很 容易 把 距离 估计 得 远 一 些 ， 以 至 于 有 可 能 需要 依赖 听觉 来 辅 
助 识 路 。 而 类 似 的 系统 性 偏差 在 概率 意义 的 直观 、 启 发 式 判 断 中 广泛 存在 着 。 

根据 卡 纳 曼 和 特 沃 斯 基 的 理论 ， 人 类 在 快 思维 中 ,会 有 3 种 评估 概率 
的 启发 式 策略 : 四 代表 性 ( representativeness )， 常 用 于 “ 当 人 被 询问 要 判断 
一 个 目标 或 事件 A 属于 类 别 或 过 程 B 的 概率 ”的 情形 。@) 实 例 或 场景 的 可 
用 性 (availability )， 常 用 于 “ 当 人 被 询问 要 评估 一 个 类 的 频率 或 者 一 个 特 
定 发 展 的 可 能 性 ”时 。@@ 从 锚 点 的 调整 (adjustment from an anchor )， 常 用 
于 “ 当 一 个 相关 值 可 用 时 的 数值 预测 ”。 这 3 种 启发 式 策略 高 度 的 经 济 ， 一 
般 也 有 效 ， 但 它们 容易 产生 系统 偏差 和 预测 偏差 。 具 体 来 说 : 


Q@” 特 沃 斯 基 过 早 去 世 ， 因 而 没 能 获奖 。 


147 


爱 犯错 的 智能 体 


(1) 代表 性 

当 测试 者 被 给 予 不 同 的 概率 比例 暗示 时 。 比 如 做 问卷 调查 时 ， 如 果 告 
诉 测 试 者 ， 某 人 是 码 农 的 概率 是 60%， 农 夫 为 40%。 在 无 其 他 信息 时 ， 测 
试 者 会 根据 这 些 概率 来 判定 一 个 人 的 职业 ; 但 在 缺乏 概率 信息 时 ， 如 果 引 
入 某 段 毫 无 价值 却 有 代表 性 的 描述 时 ， 比 如 告知 测试 者 平时 常见 的 码 农 衣 
着 打扮 是 格子 衫 或 条 纹 衫 时 ， 测 试 者 就 很 容易 被 这 个 暗示 影响 ， 导 致 不 正 
确 的 结论 。 这 是 由 于 人 对 于 结果 的 先 验 概率 的 不 敏感 性 形成 的 。 

另外 ， 由 于 人 们 对 事件 发 生 的 可 能 性 进行 评估 时 往往 依赖 于 直觉 ， 

此 很 少 考虑 事件 的 样本 数量 形成 的 影响 。 如 小 样本 情况 下 产生 的 波动 性 要 
明显 大 于 大 样本 。 但 人 直觉 上 很 容易 认为 两 者 的 波动 性 是 一 致 的 。 这 是 人 
对 于 样本 规模 存在 不 敏感 性 引起 的 。 

对 于 机 会 ， 人 类 也 存在 概率 错觉 ， 常 以 为 远离 随机 性 的 事件 不 是 太 
可 信 。 比 如 ， 局 部 有 规律 的 行为 并 不 会 影响 和 否定 全 局 随机 性 ， 但 它 却 
会 误导 人 们 形成 不 合 逻 辑 的 推理 。 这 种 误解 被 称 为 赌 徒 廖 误 (gambler’s 
fallacy )。 它 让 人 们 以 为 一 系列 事件 的 结果 会 隐 含 某 种 自 相 关 的 关系 。 比 如 
A 事件 的 结果 影响 了 B 事件 , 就 推测 B 是 依赖 于 A 的 。 比 如 最 近 天 气 转 晴 ， 
连续 几 天 大 太阳 就 会 让 人 高 概率 担心 周末 会 下 大 雨 。 而 赌 徒 则 认为 如 果 一 
直 手 气 不 好 时 ， 那 么 再 过 几 把 就 能 翻盘 回 本 甚至 赚钱 的 概率 就 很 大 。 这 些 
都 是 概率 错觉 或 赌 徒 雇 误 导致 的 结果 

不 仅 如 此 ， 在 作 预 测 时 ， 人 类 更 多 会 偏好 用 自己 手头 现 有 的 材料 作 判 
断 ， 而 非 真 正 需要 预测 的 结果 ， 即 对 可 预测 性 不 敏感 。 比 如 在 招聘 时 面试 
官 容易 受 面试 表现 影响 ， 即 使 面试 者 的 材料 准备 得 更 充实 可 信 ， 但 面试 官 
还 是 会 过 分 相信 自己 的 判断 ， 形 成 验证 性 错觉 (illusory of validity )。 而 这 
种 错觉 最 终 会 被 均值 回归 (regression toward the mean ) 检验 并 现形 。 其 
原因 在 于 ， 人 的 表现 容易 受 运 气 成 分 影响 ， 导 致 某 个 时 刻 的 发 挥 异常 精彩 
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或 失常 。 但 时 间 一 长 ， 就 会 回 到 正常 的 表现 上 去 。 这 也 能 解释 为 什么 现在 
上 海 和 一 些 地 方 的 中 考 要 考察 初 二 开始 的 每 月 、 期 中 和 期 末 考 试 成 绩 ， 本 
质 上 是 为 了 避免 “一 锤子 买卖 ”引起 的 验证 性 错觉 。 

(2 ) 可 用 性 

我 们 评估 事件 的 概率 或 某 类 别 发 生 的 频率 时 ， 会 根据 曾经 经 历 过 或 
知道 的 事情 和 例子 来 联想 。 比 如 我 们 会 根据 在 新 闻 中 报道 的 飞机 失事 ， 来 
判断 飞机 失事 率 的 高 低 ， 而 较 少 考虑 飞机 与 其 他 交通 工具 的 实际 失事 比 
例 。 又 比如 ， 我们 会 根据 周边 的 同龄 人 或 朋友 出 现 心脏 病 意外 的 情况 ， 来 
评估 自己 可 能 得 心脏 病 的 风险 。 这 种 判断 的 启发 式 称 为 可 用 性 。 然 而 ， 
可 用 性 往往 受 频率 或 概率 以 外 的 因素 影响 ， 如 搜索 集 的 有 效 性 、 可 想象 
TE (imaginability )、 错 觉 相 关 性 (illusory correlation ) 和 示例 的 可 遍历 性 
( retrievability )， 导 致 产生 预测 偏差 。 

关于 搜索 集 有 效 性 ， 卡 纳 曼 和 特 沃 斯 基 曾 做 过 一 个 实验 。 他 们 询问 测 
试 者 英文 字母 + 或 k 在 第 1 个 字母 还 是 第 3 个 字母 出 现 的 次 数 更 多 。 多 数 
人 回答 是 前 者 ， 因 为 直觉 上 更 容易 想到 第 1 个 字母 为 1 或 k 开 始 的 单词 ， 
而 要 想到 在 第 3 个 出 现 的 单词 时 ， 则 需要 费 点 脑筋 。 而 实际 上 作为 辅音 ，r 
mk 会 更 多 出 现在 第 3 个 字母 上 n, 

在 可 想象 性 方面 ， 如 果 评 估 示 例 不 在 记忆 中 的 类 别 的 概率 ， 此 时 人 就 
需要 按 某 个 规则 来 估计 。 这 种 情况 下 ， 人 会 生成 多 个 示例 ， 然 后 评估 其 可 
能 性 。 比 如 ， 我 们 在 做 商业 计划 时 ， 会 想象 可 能 碰 到 的 各 种 风险 以 评估 其 
失败 的 概率 。 由 于 想象 的 信息 并 非 真实 情况 ， 所 以 会 引起 偏差 和 认 知 错觉 。 

人 也 在 产生 错觉 相关 性 ， 如 对 两 件 共 同 发 生 的 事情 。 卡 纳 曼 和 特 沃 斯 
基 曾 让 几 个 假装 的 精神 病 患者 画 画 ， 然 后 让 测试 者 根据 给 定 的 诊断 结果 判 
断 他 们 是 否 有 偏执 狂 或 疑心 病 ， 以 及 判断 画 的 画 有 没有 独特 的 视角 。 从 测 
试 者 判断 结果 来 看 ， 测 试 者 大 概率 会 形成 有 相关 性 的 判断 ， 如 认为 疑心 病 
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与 独特 视角 之 间 存 在 相关 性 。 这 称 为 错觉 相关 性 。 其 原因 是 因为 之 前 形成 
的 成 对 相关 性 的 印象 ， 会 导致 了 随后 产生 预测 偏差 。 

(3) 从 锚 定 点 的 调整 

当 我 们 在 做 决策 时 ， 会 将 某 些 特定 的 数值 或 状态 作为 起 始点 ， 而 后 的 
调整 会 因为 此 起 始点 而 受 限 ， 从 而 影响 最 终 的 决策 方案 。 其 原因 在 于 我 们 
给 了 最 初 的 信息 或 起 始点 ， 比 如 给 予 那 些 明显 的 、 难 忘 的 证 据 过 多 的 权重 
和 重视 后 ， 就 容易 产生 牌 曲 的 认识 。 比 如 我 们 常 说 的 第 一 印象 就 是 一 种 锚 
定 效 应 (anchoring effect ).《 唐 逸 史 》 中 所 说 的 唐 明 皇 时 期 ae y L 
人 【镇 宅 赐 福 圣 君 )， 因 为 相貌 丑陋 应 举 不 中 ， 闫 愧 之 下 触 典 阶 而 死 。 这 是 
为 第 一 印象 所 累 。 正 面 的 锚 定 效应 也 有 ， 比 如 光环 效应 ， 一 个 帅气 和 自信 
的 讲 者 ， 总 能 让 人 听 报 告 时 觉得 产品 物 超 所 值 ， 当 然 也 更 容易 被 报告 忽悠 。 
这 还 是 为 第 一 印象 形成 的 锚 定 效应 所 累 。 

为 了 证 实 锚 定 效应 , 1974 年 卡 纳 曼 和 特 沃 斯 基 曾 做 了 一 个 有 名 的 实验 。 
他 们 要 求 测试 者 估计 非洲 国家 在 联合 国 的 席位 百分比 。 首 先 ， 测 试 者 需要 
旋转 一 个 有 0~100 数字 的 罗盘 ， 根 据 停 下 来 的 数字 做 初始 决定 。 测 试 者 将 
被 告知 所 选择 的 数字 比 实际 值 大 或 小 ， 然 后 测试 者 可 以 向 上 或 向 下 调整 估 
计 值 。 结 果 ， 他 们 发 现 这 些 随机 选择 的 数字 对 最 终结 果 有 明显 影响 。 初 始 
值 为 10 和 65 的 两 个 小 组 ， 最 终 调整 的 平均 值 为 25 和 45。 由 此 可 见 ， 初 
始 状态 设 定 后 ， 确 实 会 引起 锚 定 效应 ， 限 制 人 解决 问题 的 范围 。 

因此 ， 深 入 理解 这 些 启发 式 规则 ， 有 助 于 改进 在 不 确定 情形 时 人 的 决 
策 和 判断 能 力 。 但 也 需要 注意 ， 这 些 不 足 并 不 是 否定 我 们 人 类 的 直觉 能 力 。 
正如 大 部 分 时 间 我 们 都 是 健康 的 ， 但 偶尔 也 会 生病 一 样 ， 直 觉 也 是 如 此 ， 
并 非 一 直 都 是 对 的 。 即 使 统计 学 家 也 不 见得 会 是 一 个 好 的 直觉 统计 学 家 。 
近年 的 研究 表明 ， 除 了 这 些 启发 式 规则 外 ， 技 能 也 有 助 于 形成 直觉 判断 和 
选择 ， 如 专家 更 依赖 于 其 长 期 的 训练 获得 的 经 验 ， 而 会 相对 少 的 依赖 启发 
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式 规则 。 有 时 候 ， 技 能 和 启发 式 规则 会 交 奉 产生 影响 ,促进 人们 形成 快 思 
AEA, 

在 很 多 情况 下 ， 直 党 都 是 由 个 人 的 偏好 如 喜欢 不 喜欢 ， 而 不 是 精细 的 
思考 或 推理 来 驱动 。 但 当 直 觉 思维 得 不 到 解决 方案 时 ， 人 类 会 自然 转向 一 
种 更 绩 密 、 需 要 一 些 努 力 的 慢 思 维 方 式 ， 或 称 之 为 理性 思维 阶段 。 此 时 ， 
通过 漫长 学 习 期 获得 的 知识 就 会 更 多 地 派 上 用 场 。 

总 之 ,在 实际 生活 中 ， 人 类 更 习惯 于 快 思维 ， 只 在 问题 难度 上 升 到 一 
定 程 度 后 ， 才 考虑 慢 思 维 ， 两 者 经 常 在 无 颖 地 交替 使 用 着 ， 但 很 少 会 思考 
其 中 的 差异 和 潜在 的 风险 。 


认 知 错觉 与 顿悟 


人 类 智能 体 除 了 具有 快 和 慢 两 种 思维 方式 以 外 ， 还 有 独特 的 顿悟 能 力 。 
而 顿悟 的 最 终 进 发 似乎 又 是 一 种 接近 快 思维 的 方式 。 那 么 ， 我 们 现 有 的 人 
工 智能 模型 有 没 可 能 复制 这 些 机 制 呢 ? 

如 果 只 考虑 预测 性 能 ， 人 工 智 能 模型 的 “ 慢 ” 的 思维 方式 在 某 些 领域 
确实 已 经 占 了 上 风 。2017 年 以 来 各 大 人 工 智能 顶级 会 议 上 的 论文 投稿 数量 
剧 增 ， 人 脸 识别 、 图 像 检索 领域 的 识别 率 已 优 于 人 类 的 能 力 ， 这 些 都 可 以 
佐证 人 工 智能 在 利用 复杂 模型 进行 预测 的 方面 有 了 明显 的 突破 。 但 是 ,“ 快 ” 
的 思维 方式 这 块 则 还 有 明显 的 差距 。 

其 原因 ， 一 是 缺乏 人 类 学 习 的 可 塑性 ; 结果 ， 人 工 智 能 模型 只 能 沿 着 
固化 的 模型 结构 来 完成 指定 任务 ; 二 是 缺乏 对 “不 同 结构 、 不 同 模 态 的 网 
络 之 间 的 联系 ”的 学 习 ; 三 是 未 考虑 认 知 错觉 或 直觉 统计 学 的 可 借鉴 性 。 

如 果 以 现 有 的 深度 学 习 模 型 作 比 拟 ， 也 许可 以 将 认 知 错觉 当成 一 种 浅 
层 思维 方式 。 即 在 深度 模型 被 充分 训练 和 拟 合 后 ， 在 做 快速 判断 时 ， 并 不 
一 定 需 要 经 过 深层 次 的 结构 来 实现 判断 。 而 是 像 现在 深度 模型 一 样 ， 在 训 
练 好 的 浅 层 区 有 一 个 直接 连 到 输出 端的 跳 连 接 (skip connect )。 换 个 角度 来 
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说 ， 如 果 假 定 人 类 构建 的 模型 具有 由 粗 到 细 的 结构 ， 当 大 脑 中 枢 认 为 比如 
80% 的 识别 率 也 能 保证 其 正常 生存 时 ， 就 会 直接 从 相对 粗糙 的 浅 层 位 置 跳 
连接 到 最 终 的 结论 输出 端 ， 以 促进 快 思维 的 形成 。 

另外 ， 要 实现 顿悟 式 的 学 习 ， 也 许可 以 考虑 利用 不 同 结构 间 的 相似 性 。 
比如 AlphaGo 下 围棋 时 ， 就 不 是 完全 依赖 常规 的 规则 判断 ， 而 是 创新 性 地 
借助 了 图 像 处 理 和 计算 机 视觉 的 办 法 来 帮助 分 析 围 棋 棋 局 的 胜 负 。 这 从 某 
种 意义 来 看 ， 是 一 种 跨 模 态 的 结构 学 习 。 那 么 ,一 个 自然 的 问题 是 ， 这 种 
结构 迎 然 不 同 却 面向 相同 任务 的 模型 之 间 有 没有 可 能 通过 自动 学 习 来 获得 
呢 ?” 如 果 可 能 ， 也 许 人 工 智 能 体 实现 顿悟 就 有 希望 了 。 

当然 ,我 们 也 不 能 忽视 梦 可 能 对 顿悟 形成 的 作用 。 数 学 家 亨利 . 庞 加 
3E (Henri Poincare) 曾 说 过 :“ 作 为 一 种 无 意识 的 思考 方式 ， 它 却 能 帮助 形 
成 突破 困境 的 结果 。” 

除了 顿悟 和 认 知 错觉 ， 智 能 体 还 有 什么 感觉 也 可 能 以 浅 层 思维 或 快 思 
维 模式 为 主 呢 ? 
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=) 情感 与 回忆 错觉 


两 岁 的 路 比 对 小 区 里 的 肉 比 能 很 是 着 迷 。 为 了 能 听 到 她 
的 声音 ， 他 会 长 时 间 地 后 腿 直 立 着 、 前 脚 扶 着 窗 榴 傻 傻 地 站 
很 久 。 后 来 ， 那 主人 把 峻 比 态 送 走 了 。 他 才 接 受 事实 ， 慢 慢 
淡忘 了 。 过 了 许久 , 有 天 在 回 家 路 上 ，, 碰巧 遇见 肉 比 能 的 主人 ， 
路 比 仰 头 闻 了 下 ， 似 乎 想起 了 什么 ， 居 然 跟着 那 主 人 到 了 对 
方 家 楼 下 ， 隔 着 门 在 那儿 站 了 许久 。 我 想 ， 路 比 大 概 是 回忆 
起 他 那 触 不 到 的 爱情 了 吧 。 
因为 一 时 心软 ， 换 来 了 需要 时 时 照顾 和 但 外 的 路 比 。 既 养 之 ， 就 爱 之 ， 
我 也 顺便 观察 和 思考 他 的 发 育 和 情感 表现 。 走 路 ， 路 比 和 我 们 一 样 ， 都 是 
潜意识 地 直觉 反应 ， 不 会 去 关注 路 面 的 细节 。 而 作为 人 类 驯化 了 数 千 年 的 
动物 ， 狗 可 能 也 是 最 能 理解 和 分 享 人 类 情感 的 动物 中。 但 狗 的 感情 流露 更 
加 直接 、 毫 不 掩饰 。 两 相 比 较 ， 让 我 有 些 明 白 ， 人 类 的 基本 情感 表达 、 快 
思维 和 非 人 智能 体 的 区 别 并 没有 那么 明显 ,很 多 方面 甚至 是 相似 的 。 那 么 ， 
情感 是 什么 呢 ? 它 有 多 重要 呢 ? 


情感 


情感 是 人 或 智能 体 与 机 器 最 明显 的 区 别 之 一 。 古 文中 将 情感 做 了 细 分 ， 
认为 人 有 七 情 六 欲 。 七 情 的 定义 , 侨 家 、 佛教 、 医 家 略 有 不 同 。《 礼 记 : 礼 运 》 
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muB: “何谓 人 情 ? 喜 、 轻 、 哀 、 惧 、 爱 、 恶 、 和 欲 ， 七 者 弗 学 而 能 .” 而 我 
们 常 说 的 七 情 指 喜 、 经 、 衰 、 乐 、 惧 、 爱 、 恶 。 六 欲 的 记载 最 早 见 于 《 吕 
RER - 贵 生 》:“ 所 谓 全 生 者 ， 六 欲 缘 得 其 宜 者 。” 后 人 将 其 对 应 到 人 的 有 眼 、 
耳 、 自 、 舌 、 身 、 意 的 生理 需求 或 愿望 ， 即 见 欲 (视觉 )、 听 和 欲 ( 听觉 )、 
AA (嗅觉 )、 味 和 欲 (味觉 )、 触 欲 (触觉 )、 意 欲 。 

不 管 是 哪 种 情感 ， 人 类 和 非 人 智能 体 最 基本 的 情感 ， 都 是 源 于 直觉 ， 
源 自 这 种 快 思维 方式 的 表达 。 汐 和 饥饿 时 ， 新 生 儿 会 自然 地 通过 大 喊 大 叫 
大 器 来 表达 ; 而 动物 的 愤怒 和 害怕 则 是 为 了 防御 和 保护 中。 这 些 是 求生 的 
本 能 ， 不 需要 事先 学 习 任 何 复杂 的 数学 运算 和 人 情 世故 。 甚 至 于 爱 ， 从 其 
本 原 的 意义 来 看 ， 也 是 一 种 本 能 ， 是 为 了 能 更 好 地 向 后 代 传递 基因 而 形成 
的 ， 促 进 智 能 体 相 互 做 优化 选择 的 本 能 。 

随 着 人 的 成 长 ， 通 过 父母 、 家 人 、 学 校 的 教育 和 社会 的 融入 ， 情 感 的 
表达 逐渐 从 基本 的 本 能 和 生存 需求 向 更 高 层次 发 展 ， 并 灶 合 到 生活 的 各 个 
方面 。 人 类 学 会 了 记载 、 传 播 情感 ， 能 把 情感 写 进 文字 、 唱 入 歌声 、 播 到 
音乐 中 。 人 类 也 能 通过 这 些 来 分 享 、 体 会 他 人 的 情感 。 人 类 还 学 会 了 控制 
情感 ， 把 情商 〈 控制 情感 、 情 绪 的 能 力 ) 锤炼 成 成 功 的 三 要 素 之 一 ， 与 智 
商 、 时 商 (管理 时 间 的 能 力 ) 相提并论 。 古 人 在 情绪 控制 上 也 给 出 了 不 少 
善意 的 建议 , 如 清 代 画家 郑板桥 的 “难得 糊涂 ”和 北宋 文学 家 范仲淹 在 《 岳 
PARC) Pay “ADE, AAR”. 

但 情感 、 情 绪 是 如 何在 大 脑 中 表现 的 呢 ? SCHR ERI, CX 
基 在 其 书 《 情 感 机 》 中 认为 ， 这 种 看 上 去 简单 的 情感 表达 可 能 是 由 复杂 的 
多 个 小 资源 (resources ) 来 组 成 的 ,不 同 的 情绪 由 不 同 的 小 资源 组 成 。 他 
认为 简单 是 表象 ， 复 杂 是 隐 事 实 号 。 这 有 些 像 苹 果 手 机 的 设计 理念 ， 简 单 
的 操作 留 给 用 户 ， 而 背后 的 复杂 则 留 给 工程 师 们 。 也 许 大 脑 经 过 漫长 的 演 
化 后 最 终 也 以 这 一 形式 来 表达 了 它 的 功能 ， 包 括 情感 、 情 绪 。 
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那么 ， 这 种 复杂 是 如 何在 大 脑 中 形成 其 结构 的 呢 ? 马 文明 斯 基 给 了 些 
AR, 即 结构 是 层次 的 , 首先 有 直觉 的 情感 , 然后 才 有 高 层 、 抽 象 的 情感 ””。 
如 果 我 们 将 该 线索 和 之 前 谈 到 过 的 由 粗 到 细 的 结构 以 及 快 思维 和 慢 思维 方 
式 结 合 起 来 ， 再 审视 下 情绪 的 控制 方式 , 似乎 能 找到 一 些 端倪 。 

虽然 人 类 已 经 学 会 用 社会 规则 来 约束 和 控制 自己 ,使 得 真实 的 情感 不 
容易 被 表露 出 来 ,但 有 时 会 失控 。 比 如 有 些 家 长 看 到 小 朋友 作业 做 得 慢 ， 
就 很 容易 把 原本 像 拳头 一 样 收 得 好 好 的 情绪 打开 来 ， 上 暴露 出 自己 的 暴躁 脾 
气 。 从 某 种 意义 来 看 ， 这 就 是 快 思维 接管 慢 思 维 、 本 能 或 直觉 压倒 自控 能 
力 的 后 果 。 

不 仅 从 脾气 控制 上 能 看 到 情绪 的 变化 ， 人 类 还 有 可 能 从 肌肉 的 细微 变 
化 分 析 真实 情感 的 表达 。 有 研究 曾 发 现 ， 某 个 有 自杀 倾向 的 人 在 视频 前 一 
直 表 现 得 很 开心 。 然 而 ， 心 理学 家 通过 回放 视频 ， 却 发 现 其 中 有 两 三 帧 该 
患者 有 极度 痛苦 的 表情 。 心 理学 家 将 这 种 短暂 易 逝 的 表情 称 为 微 表情 。 因 
为 1 秒 可 以 录制 30 帧 ， 所 以 2-3 帧 持续 时 间 的 状态 很 难 通 过 主动 控制 情 
绪 , 或 通过 慢 思 维 控制 来 获得 , 而 更 可 能 是 潜意识 下 真实 情绪 的 表现 ,结果 ， 
有 效 识 别 微 表情 也 就 成 为 检测 人 的 真实 表情 或 情绪 的 可 行 策略 之 一 9。 

反 过 来 再 看 下 ， 现 有 人 工 智 能 框架 下 的 情感 分 析 模型 ， 似 乎 更 关注 预 
测 能 力 ， 不 管 是 用 深度 学 习 还 是 经 典 的 机 器 学 习 方 法 。 即 使 是 分 析 自 然 语 
言 中 的 情感 ， 也 很 少 考虑 情感 可 能 具有 的 结构 性 。 只 关注 预测 的 弊端 在 于 ， 
我 们 实际 上 并 没有 真正 理解 情感 。 结 果 ， 基 于 这 类 模型 获得 的 情感 很 难 让 
人 体会 到 真正 的 情感 。 举 个 例子 ， 日 本 某 机 构 曾经 研制 过 一 个 可 回答 问题 
的 服务 机 器 人 ， 然 后 将 其 放 在 幼儿 园 中 。 一 开始 ， 小 朋友 们 都 非常 开心 ， 
愿意 跟 机 器 人 一 起 玩 ， 询 问 它 各 种 问题 。 但 过 了 几 天 后 ， 服 务 机 器 人 就 被 
闲置 在 一 边 了 。 因 为 小 朋友 们 很 快 就 发 现 了 ， 这 只 是 一 台 机 器 ， 而 不 是 能 
互动 、 可 以 分 享 情感 的 智能 体 。 显 然 ， 在 情感 的 生成 和 构造 机 制 还 没完 全 
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弄 明 白 之 前 ， 我 们 现 有 技术 能 做 出 的 机 器 人 ， 还 远 不 如 宠物 狗 更 能 让 人 产 
生 情 感 上 的 依赖 和 责任 。 

人 与 机 器 的 回忆 

除了 以 上 所 述 情感 ， 还 有 一 种 对 人 类 和 非 人 智能 体 至 关 重 要 的 ， 那 就 
是 回忆 。 因 为 每 天 都 在 接触 新 事物 ， 人 类 需要 定期 清理 大 脑 中 的 硬盘 ， 留 
出 空间 学 习 新 知识 。 可 是 并 非 所 有 的 内 容 都 会 被 格式 化 ， 因 为 我 们 需要 有 
东西 回忆 来 维系 情感 。 在 多 数 情况 下 ， 人 类 会 构建 用 于 回忆 的 文档 ， 保 留 
每 条 信息 中 有 意义 的 、 关 键 的 细节 ， 去 掉 可 忽略 的 细节 。 回 忆 的 内 容 可 以 
是 一 张 人 脸 、 一 段 场景 ， 诸 如 此 类 。 然 而 ， 回 忆 有 具体 存在 哪里 ， 据 我 所 知 ， 
仍 不 是 很 清楚 ， 也 许 真 是 在 记忆 的 最 深 处 。 

但 它 能 帮 我 们 回想 起 过 去 。 比 如 有 些 人 偶尔 可 能 在 梦 中 回想 起 那 触 不 
到 的 爱 。 有 些 人 看 到 一 个 许久 未 曾 谋面 的 人 或 听 到 某 段 很 久 以 前 曾 听 过 的 音 
乐 时 ， 会 感觉 很 熟悉 ， 有 种 “似曾相识 燕 归 来 ”的 感 党 ， 然 后 会 突然 把 人 
的 各 个 细节 或 音乐 回想 起 来 。 有 了 时候 甚至 会 令 人 难以 置信 ， 走 在 路 上 ， 突 
然 就 哼 起 一 段 已 经 30 年 未 曾 唱 过 的 歌曲 。 可 是 , 在 大 脑 容 量 有 限 的 情况 下 ， 
人 类 智能 体 为 什么 要 存储 这 种 如 果 不 想起 也 许 一 辈子 都 用 不 着 的 东西 呢 ? 

再 比较 看 看 现 有 的 人 工 智 能 技术 是 如 何 处 理 记 忆 的 。 机 器 常 把 要 回 
忆 的 知识 视 为 一 个 时 序 序 列 ， 早 期 常 采 用 隐 马 尔 可 夫 模 型 来 模拟 对 时 序 
言 息 的 记忆 。 简 单 来 说 ， 就 是 模型 中 会 有 好 几 个 与 时 间 相 关 的 状态 ， 其 中 
当前 时 刻 的 状态 依赖 于 前 一 个 或 多 个 时 刻 的 状态 。 也 有 采用 在 线 学 习 的 方 
法 来 形成 记忆 。 而 近年 来 的 深度 学 习 ， 针 对 时 序数 据 的 处 理 ， 主 要 采用 
RNN ( 循环 神经 网 络 ，recurrent neural network ) P”, LSTM ( 长短 时 记忆 
网 络 , long short-term memory ) ? 和 Conv-LSTM ( 卷 积 - 长 短 时 记忆 网 络 
convolutional-LSTM ) P? 等 。 这 些 模 型 的 目的 都 是 为 了 能 尽 可 能 根据 新 的 
数据 分 布 的 变化 ,来 有 效 调整 模型 ， 以 改进 对 新 数据 的 预测 能 力 。 从 统计 
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上 来 看 ， 即 我 们 不 太 希 望 数 据 与 数据 内 在 的 分 布 总 是 被 假定 成 一 致 的 ， 总 
是 假定 每 个 数据 是 独立 从 相同 的 内 在 分 布 中 采样 得 到 的 ， 即 独立 同 分 布 性 
假设 ,而 是 希望 数据 的 采集 更 贴近 实际 情况 ， 即 数据 分 布 会 随时 间 而 改变 。 
因此 ,模型 在 建构 过 程 中 不 可 避免 地 会 引入 遗忘 机 制 。 

可 是 ， 现 有 机 器 遗忘 内 容 的 方法 与 人 类 及 其 他 非 人 智能 体 的 处 理 有 本 
质 区 别 。 因 为 机 器 的 “遗忘 ”是 为 了 适应 新 数据 的 分 布 ， 而 不 会 考虑 保留 
的 信息 对 回忆 、 情 感 的 意义 。 而 人 类 保留 信息 的 目标 并 非 完全 是 为 了 适应 
新 的 数据 分 布 ， 而 是 用 这 些 片段 来 帮助 自己 回顾 个 人 的 人 生 、 体 会 曾经 的 
酸甜苦辣 。 对 于 艺术 家 和 文学 家 来 说 ， 回 忆 也 是 创作 的 重要 源泉 。 这 些 都 
造成 了 人 与 机 器 的 本 质 性 区 别 ， 即 机 器 缺乏 对 真实 情感 的 需求 。 所 以 ， 机 
器 遗忘 机 制 在 方法 论 上 隐 含 的 假设 应 该 是 : 机 器 不 需要 回忆 ， 它 只 需要 按 
人 类 既定 的 指标 要 求 ， 实 现 精准 预测 即 可 。 

回忆 错觉 

人 的 记忆 还 有 个 很 独特 但 也 有 趣 的 现象 ， 即 回忆 和 错觉。 虽然 现在 有 很 
多 多 媒体 如 照片 、 视 频 软件 工具 可 以 帮助 人 类 形成 连续 性 的 回忆 ,但 人 对 
以 往 的 记忆 存在 不 连续 性 ， 尤 其 对 2 ~ 3 岁 以 前 的 事 往往 很 难 记 住 。 这 与 
大 脑 在 发 育 过 程 中 ， 由 粗 到 细 的 认 知 结构 产生 了 较 显 著 的 变化 有 关 ， 导 致 
原 有 的 记忆 无 法 通过 后 来 形成 的 认 知 模型 还 原 或 恢复 。 这 是 认 知 模型 变化 
导致 的 回忆 缺失 。 

另外 ， 人 在 存储 回忆 信息 时 具有 主观 性 ， 有 时 会 不 自觉 地 选择 值得 记 
忆 的 去 记忆 ， 而 舍弃 那些 不 愿意 再 想起 的 ， 因 此 ， 会 不 可 避免 地 形成 选择 
性 回忆 或 主观 回忆 缺失 。 比 如 我 因为 初 高 中 的 成 绩 惨 不 忍 睹 ， 对 那 段 时 间 
能 回忆 起 来 的 东西 就 很 少 ， 除 了 记得 父母 不 太 愿意 参加 家 长 座谈 会 以 外 。 

尽管 有 回忆 ， 人 的 回忆 也 并 非 完 全 可 靠 的 ， 可 能 还 会 人 为 地 给 自己 的 
回忆 贴 上 莫须有 的 东西 。2018 年 网 络 上 有 个 帖子 似乎 能 佐证 这 一 点 ， 就 是 
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韦唯 原 唱 、 宋 祖 英 唱 红 、1991 年 乔 羽 填词 为 第 四 届 中 国 少 数 民族 运动 会 创 
作 的 会 歌 《 爱 我 中 华 》 对 多 数 人 来 说 ， 歌 词 应 该 是 这 样 的 : 
五 十 六 个 民族 五 十 六 支 花 
五 十 六 族 兄弟 姐妹 是 一 家 
五 十 六 种 语言 汇 成 一 句 话 
爱 我 中 华 爱 我 中 华 爱 我 中 华 
嘿 罗 嘿 罗 嘿 罗 嘿 罗 嘿 罗 嘿 罗 
可 是 ， 歌 词 第 一 句 实际 是 这 样 的 :“ 五 十 六 个 星座 五 十 六 支 花 "。 但 是 ， 
几乎 很 少 有 人 会 记得 是 “星座 ”而 不 是 “民族 "”， 因 为 数字 “五 十 六 ”的 原 
因 ， 人 的 记忆 会 非常 自然 地 把 它 与 “民族 ”挂钩 ， 而 非 讨论 了 半天 也 没 明 
白 为 什么 是 作者 选择 的 “星座 ”。 这 也 是 回忆 错觉 的 一 种 ， 称 为 曼 德 拉 效 应 
( Mandela effect )， 是 指 很 多 人 都 发 觉 对 同一 事物 的 记忆 与 事实 有 出 入 的 现 
象 。 一 种 可 能 的 解释 是 人 在 删除 信息 后 ， 重 建 的 时 候 更 容易 将 与 记忆 最 紧 
密 相关 但 不 一 定 正确 的 内 容 联 系 ， 并 还 原 完整 的 信息 
更 有 其 者 ， 还 有 可 能 把 自己 的 回忆 强行 建立 在 
不 真实 的 记忆 上 。 正 如 哲学 家 尼采 所 说 ,“ 谎 言说 
了 一 千 遍 也 就 成 了 真理 "”。 莱 昂 纳 多 主演 的 烧 脑 电 
影 《 禁 闭 岛 》( Shutter Island) 中 就 塑造 了 具有 这 种 
回忆 的 角色 : 精神 分 裂 的 莱 蒂 斯 ， 为 了 逃避 现实 中 
的 痛苦 经历 ， 在 精神 中 塑造 了 另 一 个 自己 ， 并 孕育 
一 个 完整 的 故事 和 “回忆 
除了 这 些 ， 还 有 一 种 令 人 揪心 的 “回忆 低级 
格式 化 ”导致 的 回忆 障碍 ， 那 就 是 阿尔 茨 海 默 病 
ESTA ( Alzheimer disease， 老 年 痴呆 症 的 一 种 ) P. qz 
Hg. 里 根 ”特点 是 ， 人 会 一 点 一 点 把 自己 的 回忆 抹 掉 ， 如 美国 


图 18.1 美国 第 40 任 
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前 总 统 里 根 ( 图 18.1 ) 后 来 记 不 得 自己 曾 当 过 总 统 ， 被 称 为 “光纤 之 父 ” 
的 高 锟 (图 18.2 ) 在 2009 年 获得 诺 贝 尔 物 理学 奖 时 已 经 不 记得 自己 在 光纤 
方面 的 成 就 ,还 有 更 多 患者 会 在 患 病 后 记 不 起 自己 的 家 人 。 据 估计 ， 全 球 
有 超过 3500 万 人 患 有 老年 痴呆 症 ， 每 7 秒 就 新 增 一 名 患者 ， 而 中 国 则 拥有 
世界 上 最 多 的 老年 痴呆 症 患者 。 有 研究 表明 ， 这 可 能 是 基因 长 期 演化 形成 
的 一 种 “ 自 毁 ”机 制 。 只 是 以 前 在 正常 的 自然 环境 生存 时 ， 人 类 的 寿命 还 
活 不 到 需要 启动 这 种 “ 自 毁 "机 制 , 因此 患 病 数量 远 少 于 现在 。 还 有 研究 发 现 ， 
在 老年 痴呆 证 患者 的 大 脑 里 有 “老年 班 ” 现 象 ( 即 纤维 状 类 淀粉 蛋白 质 斑 
块 沉 积 ， 英 文 名 senile plaque ) ( 图 18.3 )， 并 以 此 来 推测 老年 痴呆 症 发 生 的 
风险 。 遗 憾 的 是 ， 到 目前 为 止 ， 人 类 也 没完 全 明白 它 的 机 制 ， 不 少 相 关 的 
研究 仍 是 空白 。 


图 18.2 “光纤 之 父 ” 高 锟 图 18.3 淀粉 样 蛋白 B 
免疫 染色 显示 
的 “老年 斑 ” 


不 管 是 否 存在 回忆 错觉 ， 生 理 的 、 心 理 的 ， 回 忆 都 是 人 类 维系 情感 的 
重要 组 成 部 分 ， 而 情感 又 是 人 和 非 人 智能 体 区 别 于 机 器 的 重要 标志 。 
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要 设计 一 个 真正 逼近 智能 体 的 人 工 智 能 体 ， 也 许 不 应 只 依赖 于 大 数据 、 
图 形 处 理 器 ( graphics processing unit, GPU) 的 并 行 计算 能 力 ， 毕 竞 我 们 
对 智能 体 的 了 解 还 太 浅 、 太 少 。 哪 怕 是 一 只 从 没 学 习 过 数学 、 两 岁 大 的 小 
比 熊 具备 的 情感 ， 现 有 的 服务 机 器 人 尽管 考虑 了 各 种 复杂 的 数学 模型 ， 仍 
然 还 只 能 望 其 项 背 。 这 里 面 显然 不 纯粹 是 计算 能 力 的 问题 ， 更 关键 的 是 对 
情感 甚至 智能 形成 的 基本 原理 缺乏 颠覆 性 的 思路 。 

我 不 怀疑 现 有 的 人 工 智 能 模型 可 以 以 足够 高 的 精度 来 预测 智能 体 的 
情感 状态 ,但 我 比较 怀疑 这 些 模 型 是 否 能 真正 明白 什么 是 情感 ? 什么 是 回 
忆 ? 如 果 在 建 模 时 ， 缺 乏 从 直觉 情感 到 深层 次 情感 的 递 进 建 模 过 程 ， 缺 乏 
形成 智能 体 个 体 与 众 不 同 的 多 样 性 ， 那 么 还 原 出 来 的 情感 也 只 能 是 机 器 的 
机 械 表 现 。 

也 许 ， 我 们 可 以 考虑 重 拾 “观察 ”这 个 古朴 的 研究 方法 ， 去 深入 了 解 
情感 的 发 育 ， 比 如 儿童 的 情感 发 育 。 考 虑 到 人 类 儿童 期 过 于 漫长 ， 也 可 以 
观察 最 能 理解 人 类 情感 、 成 熟 又 比较 快 的 宠物 狗 的 情感 、 常 识 发 育 。 

到 目前 为 止 ， 本 系列 讨论 了 个 体 在 视听 觉 、 语 言 、 认 知 、 情 感 等 方 
面 存 在 的 多 种 多 样 的 错觉 。 但 是 ， 要 促进 智能 体 的 相互 发 展 ， 必 须要 组 成 
群体 、 构 成 社会 。 那 么 ， 智 能 群体 中 的 回忆 是 如 何 体现 的 呢 ? 群体 有 没有 


错觉 呢 ? 
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=@ 群体 的 情感 共鸣 ; 
Al 写 歌 ， 抓 不 住 回 忆 ? 


湘潭 
作词 : 平 猫 
湘潭 总 出 现 梦 里 回忆 多 是 从 前 
梦 里 玩 要 中 的 我 天 真得 像 小 孩 
踢 街 边 的 水 去 一 中 跳 下 围墙 游 雨 湖 
魂 绕 梦 莹 的 是 盼 你 快 回 的 父母 
FREED RMS 我 都 想 回 湘潭 
听 那 亲切 的 湘 音 哮 那 家 常 琐事 
在 球 着 槟 郴 味 的 小 城 有 我 童年 的 伙伴 
湘潭 留 着 我 的 是 那 颗 心 
和 我 在 杨梅 洲 江 边 走 一 走 eee 
直到 窜 湾 的 灯 都 熄灭 了 也 不 停留 
我 爱 深 吸 江 边 的 风 我 爱 位 立 望 衡 亭 边 
走 到 十 八 总 的 尽头 吃 碗 满洲 湘 ( 乡 ) 情 的 米粉 


QD 本 节 的 缩减 版 《从 歌声 中 谱写 游子 思乡 ) 发 表 在 《中 国 科学 报 》2019 年 2 月 11 日 的 博客 版 。 
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如 今春 节 已 在 即 
没什么 能 够 阻挡 我 

不 管 路 途 多 未 远 
湘潭 还 有 我 的 

和 我 登记 峰 看 日 出 似 火 
敢 叫 日 月 换 新 天 的 传奇 
币 律 德 怀 乌 石 故 里 

走 到 城 里 头 的 里 面 

和 我 在 湘潭 的 江 边 走 一 走 
看 那 列车 城 铁 飞 驰 两 岸 
和 我 在 湘潭 的 江 边 走 一 走 


我 开始 计划 回程 
归 家 的 思念 


事情 有 多 繁忙 


流传 万 代 
重 温 湘 大 美好 时 光 
点 份 臭 豆腐 和 嗪 螺 


直到 两 岸 的 灯 都 熄灭 了 也 不 停留 


RAK LG 
停 在 路 边 的 农家 乐 
和 我 在 湘潭 的 江 边 走 一 走 


我 会 去 看 关 圣 左 
吃 有 紫 苏 的 水 煮 活 鱼 


直到 两 岸 的 灯 都 熄灭 了 也 不 停留 


写 于 2019 年 1 月 9 日 


Al 2012 年 以 来 ， 人 工 智 能 (artificial intelligence, AI) 方面 的 成 就 
是 硕果 累累 ， 在 与 预测 相关 的 领域 中 似乎 都 能 大 获 全 胜 ， 如 2018 年 初 
AlphaZero 下 出 了 颠覆 300 年 围棋 棋谱 的 创新 围棋 开局 ; 如 在 张学友 演唱 会 
中 通过 人 脸 识 别 技术 多 次 抓 到 犯罪 嫌疑 人 。 在 艺术 领域 , 通过 风格 迁移 技 
A. AL 也 能 夯 出 与 印象 派 画 家 类 似 的 作品 。 在 文学 创作 方面 ， 微 软 的 机 器 
人 “小 冰 ” 甚 至 出 了 本 诗集 。 在 音乐 领域 ，AI 不 仅 能 形成 动听 的 旋律 ， 还 
推出 了 一 些 流行 歌曲 。 甚 至 还 推出 了 虚拟 歌手 ， 如 基于 日 本 雅马哈 公司 的 
Vocaloid 软件 推出 的 “初音 未 来 ”和 我 国 在 其 汉化 版 上 推出 的 “ 洛 天 依 ”。 
在 B 站 上 还 能 昕 到 洛 天 依 的 一 些 原 唱歌 曲 ， 如 《 达 拉 崩 吧 》。 洛 天 依 也 因 
其 独特 的 形象 和 电子 音色 的 演唱 方式 收获 了 不 少 粉丝 。 人 们 不 禁 有 些 担忧 ， 
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是 否 艺 术 这 块 天 空 ， 比 如 写 歌 ， 也 会 于 不 久 后 被 AI 占领 呢 ? 

要 解 开 这 份 疑惑 ， 我 想 用 我 上 面 改 编 的 《湘潭 》 的 歌词 来 分 析 一 下 人 
类 和 AI 在 写 歌 上 的 本 质 区 别 。 

我 是 湖南 湘潭 人 ，2019 年 初 因 临 近 春节 ， 老 乡 群 吃喝 着 要 聚会 ， 我 平 
时 又 喜欢 唱 唱 歌 ， 于 是 被 老乡 们 众生 着 要 到 年 会 唱 首 歌 。 我 想 ， 也 许可 以 
唱 首 能 反映 在 外 打拼 的 湘潭 游子 对 故乡 的 思念 和 回忆 的 歌 ， 便 想到 了 改编 
著名 民谣 歌手 赵 雷 作词 作曲 的 《成 都 》 的 歌词 。 


没 想到 自己 改编 并 演唱 分 享 后 ， 反 响 很 强烈 。 我 想 ， 这 应 该 是 歌词 引 
起 了 老乡 们 的 情感 共鸣 吧 。 
智能 群体 的 情感 共鸣 


为 什么 会 有 这 种 群体 的 共鸣 呢 ? 我 这 里 分 析 下 我 改写 的 歌词 。 

我 在 歌词 中 首先 提 到 的 是 梦 ， 梦 里 有 的 是 从 前 的 记忆 和 了 盼 子女 快 回 家 
的 父母 。 从 前 的 记忆 是 湘潭 因 处 在 丘陵 地 带 ， 下 雨 比 较 多 。 下 雨天 ， 我 喜 
欢 踢 着 街 边 的 水 去 上 学 ; 记忆 是 家 门口 有 个 雨 湖 公 园 ， 当 时 有 围墙 ， 昔 年 
的 小 伙伴 们 都 喜欢 候 墙 去 公园 里 游玩 。 这 些 可 能 是 多 数 老乡 们 都 曾 有 过 的 
记忆 。 人 一 旦 有 过 这 些 记忆 , 或 多 或 少 都 会 在 梦 里 出 现 。 这 是 第 一 组 共鸣 点 。 

其 次 ， 我 写 到 了 每 逢 佳节 倍 思 亲 的 感觉 。 对 于 在 外 的 湘潭 人 来 说 ， 回 
家 最 明显 的 体会 之 一 是 ， 开 窗 呼吸 到 的 空气 中 都 弥漫 着 槟 椰 味 ， 这 是 家 乡 
特有 的 味道 。 而 湘江 边 的 江 风 、 望 衡 襄 的 远 胱 ， 还 有 最 近 装 饰 一 新 的 窑 湾 
历史 文化 街区 ， 也 是 老乡 熟悉 上 且 难 忘 的 。 当 然 ， 到 了 春节 ， 归 心 似 箭 的 心 
情 是 所 有 在 外 打拼 的 人 都 有 的 。 这 是 第 二 组 共鸣 点 。 

另外 ， 湘 潭 是 个 非常 特别 的 、 值 得 每 个 国人 记 住 的 城市 ， 因 为 伟大 领 
袖 毛 泽 东 就 是 从 归属 湘潭 的 韶山 市 走出 来 的 ， 还 有 他 的 湘潭 乌 石 老乡 茧 德 
怀 元 是， 还 有 很 多 有 名 的 文人 墨客 。 所 以 ,我 借用 了 毛泽东 写 于 1959 年 的 
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著名 诗作 《七 律 - 到 韶山 》 中 “为 有 牺牲 多 壮志 ， 敢 叫 日 月 换 新 天 ”中 的 
后 一 句 ， 来 介绍 了 这 位 在 中 国 近 现 代 历 史上 有 重要 地 位 和 影响 力 的 传奇 人 
物 ， 毛 主席 。 这 是 第 三 组 共鸣 点 。 

除了 值得 回忆 的 人 人、 美景 ， 湘 潭 还 有 美食 ( 图 19.1 )， 米 粉 、 臭 豆腐 、 
嗪 螺 的 吃 法 与 外 地 不 同 ， 甚 至 与 长 沙 的 吃 法 也 都 有 区 别 ， 如 同 湖南 “十 里 
不 同音 ”一 样 。 还 有 ， 每 个 在 外 的 湘潭 游子 都 挂念 着 的 湘潭 特色 菜 “ 有 紫 
苏 的 水 者 活 鱼 "。 这 是 第 四 组 共鸣 点 。 


(d) 


图 19.1 湘潭 风景 与 小 吃 
a) 湘潭 市 的 雨 湖 公 园 ; (b) 湘江 两 岸 夜景 ; ) MRAM; (d) ÉR 


所 有 这 些 ， 构 成 了 正面 介绍 湘潭 的 全 景 画像 。 
歌词 呢 ， 写 得 比较 朴实 ， 没 有 多 少 形容 词 。 又 因为 这 是 歌 不 是 诗 ， 所 
以 在 用 词 的 时 候 稍微 注意 了 一 下 ， 和 希望 唱 的 时 候 能 让 听众 听 起 来 更 舒服 一 
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些 。 比 如 歌词 中 ,“ 踢 着 街 边 的 水 去 一 中 ”的 “一 ”,“ 跳 下 围墙 游 雨 湖 ”的 “ 雨 ” 
都 是 通过 从 鼻腔 向 上 冲击 头 腔 来 发 音 ， 这 样 可 以 在 相对 平淡 的 音调 中 形成 
听 感 比较 高 的 音 ， 把 层次 感 拉 出 来 ; 而 “我 开始 计划 回程 ”， 则 用 了 像 讲 话 
式 的 唱法 ， 让 人 觉得 有 归 家 的 感觉 ;“ 流 传 万 代 ” 的 “流传 ” 则 用 了 气 声 送 
出 ， 以 便 能 更 好 表达 真情 。 还 有 和 豆腐 和 嗪 螺 的 次 序 ， 唱 的 时 候 ， 把 嗪 螺 
置 后 更 容易 形成 好 听 的 开口 音 , 如 果 把 臭 豆腐 置 后, 就 会 唱 得 怪 怪 的 。 当 然 ， 
还 有 湘潭 的 名 胜 昭 山 古寺 , 我 特意 把 后 面 的 “ 山 " 字 用 san 而 非 shan 发 出 来 ， 
因为 南方 的 湘潭 人 都 这 么 说 的 〈 算 了 ， 这 句 我 编 不 下 去 了 ， 就 是 按 湘潭 话 
音 的 ， 本 来 觉得 唱 错 了 想 重唱 ， 但 后 来 想 想 ， 应 该 也 没 问 题 ， 就 当 作 个 
性 标签 好 了 。 ) 

不 管 是 怎么 唱 的 ， 这 歌词 体现 很 多 与 时 间 相关 的 元 素 ， 儿 时 的 真实 记 
忆 、 历 史 的 真实 记忆 ， 再 加 上 游子 盼 回 家 的 心情 。 这 让 很 多 老乡 仿佛 看 到 
了 自己 从 前 的 影子 ， 于 是 也 希望 能 分 享 这 段 彼此 共有 的 回忆 和 思念 。 

反观 AI 写 歌 ， 我 不 否认 AI 可 以 写 出 语言 非常 华丽 ， 甚 至 难 辨 人 和 机 
器 真 假 的 歌词 。 但 是 ， 它 能 写 出 回忆 吗 ? 不 妨 看 下 ， 如 果 要 用 A Sik, 
它 需 要 哪些 技巧 或 工具 。 首 先 ， 它 必然 是 要 学 习 的 ， 学 习 的 素材 是 曾经 有 
过 的 歌 。 其 次 ， 它 必然 要 服从 写 歌词 时 需要 注意 的 一 些 基本 规则 。 最 后 ， 
它 要 根据 旋律 来 进行 匹配 、 对 齐 。 但 是 ， 能 引起 人 们 形成 情感 共鸣 的 回忆 
却 不 是 那么 好 学 的 。 

群体 共鸣 的 学 习 

什么 是 共鸣 ?从 物理 学 上 来 比拟 , 粗略 来 说 ， 可 以 看 成 是 系统 所 受 激 
励 的 频率 与 该 系统 的 某 阶 固 有 频率 相 接近 时 ， 系 统 振幅 显著 增 大 的 现象 ， 
即 共振 。 一 首 歌 要 让 智能 群体 产生 情感 上 的 “共振 ”或 共鸣 ， 则 必然 需要 
有 共同 的 经 历 ， 也 许 只 是 一 个 小 的 动作 ， 一 份 吃 不 腻 的 点 心 ， 一 件 无 足 挂 
齿 的 小 事 。 然 而 ， 如 果 时 间 跨 度 长 一 点 ， 这 些 本 可 以 形成 共鸣 的 内 容 ， 都 
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会 被 人 工 智能 的 算法 抹杀 掉 。 因 为 这 些 引 发 共鸣 的 元 素 ， 需 要 捕捉 的 不 是 
语法 层次 上 的 ， 而 是 情感 层面 的 ， 甚 至 是 包含 了 相当 长 时 间 记 忆 的 、 情 感 
层面 的 元 素 。 

然而 ， 这 些 元 素 并 不 是 那么 能 显而易见 的 获得 。 对 于 现 有 的 AI 算 
法 来 说 ， 能 包含 时 间 序 列 信 息 的 模型 是 早期 的 隐 马 尔 可 夫 模型 ( hidden 
Markov model )、 现 在 流行 的 深度 学 习 中 的 循环 神经 网 络 ( recurrent neural 
network )、 长 短 时 记忆 模型 (long-short term memory ) 以 及 它们 的 各 种 变 
形体 。 这 些 模型 或 多 或 少 具有 时 间 记 忆 能 力 和 独特 的 遗忘 机 制 ， 因 此 可 以 
按时 间 的 变化 来 有 选择 地 记忆 新 事物 、 遗 忘 旧 事物 。 但 是 ， 如 果 对 于 时 间 
跨度 很 长 的 事情 ， 这 些 模型 可 能 都 无 法 形成 有 效 的 记忆 ， 因 为 遗忘 机 制 和 
对 未 知事 件 预测 性 能 的 追求 决定 了 它们 在 取舍 上 无 法 像 人 类 一 样 。 

而 人 类 的 记忆 在 回忆 上 是 非常 奇妙 的 ， 比 如 一 首 歌 ,我 们 可 能 三 四 十 
年 都 不 去 唱 它 ， 可 冷 不 丁 哪 天 它 就 从 你 脑袋 里 冒 了 出 来 ， 张 口 就 唱 了 。 按 
MA AI 的 逻辑 , 这 是 浪费 存储 空间 的 无 用 信息 , 应 该 被 早早 清除 的 。 可 是 ， 
正 是 有 了 这 些 毫 无 价值 的 、 不 知道 存在 哪个 位 置 的 共同 记忆 ， 才 让 人 类 在 
年 长 后 有 了 茶余饭后 的 谈资 ， 有 了 情感 上 的 寄托 和 群体 共鸣 ， 有 了 亲情 、 
爱情 的 维系 。 不 夸张 地 说 , 这 种 记忆 模式 可 能 不 仅 人 有 , 非 人 智能 体 也 都 有 ， 
反而 AI 目前 还 没有 。AI 出 现 这 种 局 限 性 ， 一 个 可 能 的 原因 是 回忆 和 引起 
共鸣 的 事情 并 非 是 经 常 需要 用 到 的 ， 从 每 个 人 的 人 生 历 程 来 看 ， 都 是 小 其 
至 极 小 概率 事件 , 但 从 一 个 群体 比如 老乡 们 来 看 , 却 又 能 通过 情感 的 “共振 ” 
或 共鸣 形成 一 个 超过 简单 累加 的 、 强 大 的 振幅 。 结 果 ， 不 管 是 回忆 ， 还 是 
共鸣 ， 对 AI 来 说 ， 目 前 都 还 找 不 到 适当 的 数学 模型 去 刻画 它 。 

在 缺乏 这 种 时 间 大 尺度 、 全 局 观 的 情况 下 ，AI 写 歌 是 抓 不 住 回忆 的 ， 
也 就 很 难 让 人 形成 情感 上 的 共鸣 。 显 然 ， 这 一 弱点 也 注定 了 现 有 的 AI 还 很 
难 真正 变 得 像 人 类 一 样 ， 更 不 用 说 超越 人 类 了 。 
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要 解决 这 一 问题 ， 我 们 需要 构建 和 学 习 “ 情 感 共鸣 ”的 理论 和 相应 的 
提取 算法 ， 分 析 哪 些 是 可 能 形成 一 加 一 远大 于 二 的 事件 。 除 此 以 外 ， 由 于 
对 单个 个 体 来 说 ， 这 些 形成 共鸣 的 事件 都 是 很 少 出 现 的 。 要 让 AI 学习 到 能 
引起 共鸣 的 回忆 ， 需 要 的 数据 在 时 间 跨 度 、 量 级 和 背景 信息 收集 上 都 要 和 远 
大 于 目前 已 知 的 其 他 数据 集 。 因 此 ， 在 如 何 构 建 这 样 的 数据 集 上 就 有 很 强 
的 挑战 性 。 而 在 算法 设计 上 ， 可 能 得 分 析 一 下 哪些 信息 或 事件 尽管 对 当前 
或 未 来 的 预测 是 无 用 的 ， 但 却 可 能 在 未 来 某 个 时 间或 若干 年 后 能 帮助 形成 
“情感 共鸣 ”的 。 通 过 这 样 的 计算 ， 筛 选 出 可 以 允许 长 时 间 保 存在 存储 器 里 
的 信息 或 事件 ， 并 通过 群体 大 数据 来 形成 关联 。 最 后 ， 从 应 用 级 来 看 ， 研 
究 “情感 共 鸣 " 对 于 服务 机 器 人 在 家 庭 中 的 情感 维系 和 替代 宠物 也 非常 重要 。 

除了 群体 的 情感 共鸣 和 回忆 外 , 群体 之 间 是 否 也 存在 某 些 群体 错觉 呢 ? 
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跨 界 
我 是 理科 生 
混 进 了 一 诗歌 群 
学 习 与 赏析 
诗歌 中 的 意象 与 意境 
有 天 好 奇 地 问 了 多 
为 什么 
诗歌 一 天 能 写 好 多 
科研 一 年 才 一 点 点 
灵感 怎么 差 那么 多 ? 
于 是 
BEYE T 45 
有 人 说 
科研 哪 要 灵感 
有 人 说 
你 知道 区 别 吗 
有 人 说 
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你 做 的 是 科研 吗 
一 点 数学 也 没有 
我 只 好 
展示 了 一 些 
我 在 
数学 部 视 链 
最 底 端 的 
统计 学 成 果 
还 有 
物理 教学 的 
一 点 心得 
结果 
整个 群 里 
只 有 
两 个 理科 生 
在 激烈 地 
辩论 着 
偶尔 会 有 人 发 表情 包 暖 场 
群 主 最 后 
不 得 不 出 面 
这 里 是 文学 群 
请 不 要 讨论 不 相关 的 内 容 
平 猫 
2018 年 12 月 1 日 


个 体 成 群 后 ， 才 便于 延续 和 壮大 。 人 类 和 非 人 智能 体 在 结 成 群体 的 进 
程 中 ， 从 生存 需求 的 共生 到 精神 需求 的 依赖 ， 经 历 了 蚁 是 曲折 的 变化 和 调 
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整 ， 最 终 形成 了 精彩 纷呈 、 各 式 各 样 的 群体 。 而 聚集 成 群 的 个 体 ， 会 与 独 
立 存 在 或 独处 时 ， 有 一 些 明显 的 区 别 "。 那 群体 的 行为 是 如 何 体现 的 呢 ? 
它 对 智能 有 何 影响 ， 又 有 哪些 错觉 呢 ? 


群体 智能 

人 类 对 群体 行为 的 研究 年 代 比 较 悠久 。 我 国 著名 科学 家 钱学森 先生 在 
20 世纪 90 年 代 曾 提出 综合 集成 研讨 厅 的 体系 。 他 强调 专家 群体 应 以 人 机 
结合 的 方式 进行 协同 研讨 ， 共 同 对 复杂 巨 系统 的 挑战 性 问题 进行 研究 。 而 
将 群体 行为 关联 至 智 能 学 习 则 常 从 两 个 方面 出 发 一 是 分 析 宏 观 的 群体 表 
现 ， 二 是 审视 微观 的 群体 行为 。 宏 观 主要 从 非 人 智能 体 的 角度 着 手 ， 以 观 
察 动物 的 群体 行为 为 主 。 

天 上 的 飞鸟 比较 容易 看 到 ， 但 是 形成 能 变换 各 种 形状 的 飞鸟 群 却 已 
不 多 见 (图 20.1 )。 不 多 见 的 原因 与 人 类 曾 过 度 使 用 化 学 药品 和 肥料 有 关 ， 
美国 科普 作家 荤 切 尔 . 卡 逊 在 其 1962 年 的 科普 书 《寂静 的 春天 》 中 介绍 
过 。 不 过 偶尔 还 能 见 到 飞鸟 群 ， 所 以 1995 年 埃 伯 哈 特 (Eberhart) 和 肯 尼 
迪 (Kennedy) 博士 就 分 析 了 飞鸟 集群 更 食 的 行为 。 他 们 发 现 当 鸟 群 需要 
的 食物 处 在 鸟 群生 活 的 某 个 区 域 时 ， 在 搜索 食物 时 ， 每 只 鸟 不 仅 会 受 自己 
飞行 的 路 径 影响 ， 还 会 受 与 它 
相 邻 鸟 群 的 局 部 飞行 路 线 以 及 
乌 群 以 群体 的 整体 飞行 路 线 所 
影响 。 鸟 群 会 通过 共享 这 些 个 
体 和 群体 的 信息 ， 并 通过 不 断 
交换 和 更 新 这 些 信息 ， 最 终 久 
群 能 用 “最 优 ”的 效率 找到 
食物 。 基 于 这 一 观察 ， 埃 伯 哈 pe 
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特 和 肯尼迪 博士 提出 了 一 套 群体 智能 算法 ， 称 为 鸟 群 优化 算法 (bird swarm 
optimization )。 如 果 把 每 只 鸟 假设 成 一 颗粒 子 ， 一群 鸟 则 构成 粒子 群 ， 则 
鸟 群 算法 还 有 个 更 智能 和 科幻 的 名 字 ， 叫 粒子 群 优化 算法 (particle swarm 
optimization, PSO ) "7, 

BMA EW CS A BE 
体 行 为 ， 地 上 的 穴 蚁 也 有 ， 
如 最 方便 观察 、 能 频繁 见 
到 、 密 度 又 极 高 的 群体 是 蚂 
蚁 (图 20.2)。 意 大 利 学 者 
ZEX (Dorigo) 和 马 尼 伍 
(Maniezzo ) 等 观察 了 蚂蚁 
的 竟 食 行为 ， 在 20 世纪 90 
年 代 曾 提出 了 蚁 群 系统 Cant 
system 或 ant colony system ) 不 同 于 飞鸟 , 蚂蚁 是 通过 一 边 行路 一 边 释 放 “ 信 
息 素 ”物质 ( 英文 为 : pheromone。 通 俗 点 讲 ， 是 体味 的 一 种 ) 来 形成 群体 
葛 食 行为 的 。 蚂 蚁 会 沿 着 “信息 素 ” 浓 度 高 的 路 径 来 行走 ， 同 时 它 走 过 的 
时 候 也 会 留 下 自己 的 追踪 “信息 素 "， 进 一 步 强化 了 可 能 到 达 食 物 的 最 短路 
径 。 同 时 ,“ 信 息 素 ”会 随时 间 的 增长 而 挥发 ， 从 而 保证 了 路 径 搜 索 不 易 从 
化 ， 失 去 灵活 性 。 通 过 蚁 群 信息 素 的 反复 增强 和 淡化 过 程 ， 蚁 群 就 能 沿 最 
短路 径 到 达 食 物 了 "1。 

蚁 群 和 乌 群 优化 算法 是 文献 中 最 经 典 的 两 个 群体 智能 算法 。 事 实 上 ， 
非 人 智能 体 的 群体 行为 有 很 强 的 多 样 性 ， 如 果 留 意 观 察 各 种 群体 的 行为 表 
现 ， 还 能 找到 更 多 很 有 新 意 的 群体 智能 算法 。 

举例 来 说 ， 美 国 得 州 奥 斯 丁 议会 大 桥 有 和 群 蝙蝠 。 据 估计 ， 桥 下 生存 了 
150 万 只 墨西哥 无 尾 蝙蝠 ( 图 20.3 )。 每 到 傍晚 时 分 就 会 出 洞 ， 成 群 飞行 去 
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旅游 景点 。 对 飞行 类 群体 智 
能 行为 感 兴趣 、 和 希望 找到 新 
算法 的 人 不 妨 去 观察 一 下 。 
海洋 中 的 鱼 群 也 自 有 其 特点 。 
较 小 的 鱼 偏 好 成 团 ， 形 成 比 
较 大 的 形状 (图 20.4), 与 飞 图 20.3 ”蝙蝠 群 
鸟 不 同 ， 研 究 表明 ， 小 鱼 爱 
成 群 是 因为 与 个 体 相 比 ， 鱼 
群 的 体积 要 大 得 多 ， 能 够 让 
潜在 的 捕食 者 误 以 为 是 比 自 
己 大 的 生物 体 ， 从 而 不 敢 贸 
然 攻 击 ， 也 就 让 小 鱼 多 了 生 
存 的 机 会 。 除 了 竟 食 和 生存 
行为 ， 迁 徙 行为 也 可 以 研究 。 
比如 大 雁 南 飞 时 的 头 雁 引航 图 20.4 和 鱼 群 
的 人 字形 队 现象 。 在 迁徙 中 ， 
头 雁 与 其 他 从 雁 在 决定 路 线 的 决策 权 方 面 显然 存在 大 的 差异 。 

当然 ， 动 物 的 群体 行为 也 并 非 始 终 优 于 个 体 ， 常 常 是 机 会 与 风险 并 
存 。 比 如 ， 蚁 群 靠 追 中 “信息 素 ” 来 砚 食 的 行为 就 不 是 百分之百 安全 。 假 
如 有 一 只 引路 的 工 蚁 碰巧 离开 了 有 “信息 素 ” 的 路 径 ， 跟 着 它 集 体 疯 食 
的 蚂蚁 都 会 离开 路 径 ， 极 端 情况 下 会 形成 蚂蚁 乱 转 Cant mill) 的 循环 圆 
Pel (图 20.5), 最 终 导致 蚂蚁 因为 体能 耗 尽 而 集体 死亡 。 这 是 与 群体 优 
势 相 背 的 群体 错 党 。 再 比如 小 鱼 的 鱼 群 现象 ， 有 些 捕食 者 就 会 故意 利用 
这 个 习性 。 如 杀人 鲸 (kiler whale， 也 称 虎 鲸 ) 为 了 提高 吃 小 鱼 的 效率 ， 
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会 有 意识 地 分 散 开 将 小 鱼 们 围 
起 来 ， 驱 使 小 鱼 被 动 在 包围 圈 
内 形成 密集 的 鱼 群 ， 然 后 虎 
鲸 便 会 轮流 冲 和 人 圈 中 饱餐 一 顿 
(图 20.6)。 这 是 不 同 智 慧 级 别 
图 20.5 蚂蚁 乱 转 的 群体 智能 的 对 决 结 果 。 

不 仅 非 人 智能 体 存在 值得 研 
究 的 群体 行为 , 微观 层面 中 也 有 。 


微观 和 非 生 命 体 的 群体 
算法 

微观 层面 可 以 分 析 群 体 行为 
的 , 一 种 是 物理 学 中 经 常 提 及 的 
布朗 运动 ， 即 微小 粒子 的 无 规则 

图 20.6 虎 鲸 在 学 习 捕 食 鱼 群 技巧 运动 。 这 种 运动 从 单个 微粒 来 看 
是 无 规则 、 无 序 的 , 但 从 群体 或 整体 来 看 却 能 形成 运动 中 的 动态 平衡 。 最 
早 是 英国 植物 学 家 R: 布朗 从 花粉 中 观测 到 这 一 现象 。 尽 管 解释 很 多 ， 真 
正 有 效 的 解释 还 得 归功 于 维 纳 于 1863 年 提出 的 分 子 振动 假说 和 爱 因 斯 坦 的 
分 子 运动 论 原 理 。1926 年 法 国人 贝 兰 和 斯 维 德 伯 格 因为 实验 验证 了 爱 因 斯 
坦 的 假说 而 获得 诺 贝 尔 物理 学 奖 。 

在 布朗 运动 的 基础 上 ， 科 学 家 提出 了 模拟 退火 (simulated annealing ) 
的 智能 算法 。 它 模拟 了 金属 退火 中 的 加 温 过 程 、 等 温 过 程 和 冷却 过 程 ， 通 
过 增强 和 减弱 随机 游 走 的 分 子 的 布朗 运动 强度 ( 图 20.7 )， 使 其 最 终 形 成 有 
序 的 全 局 平衡 或 最 优 解 "1。 

除了 分 子 的 群体 行为 外 ， 科 学 家 们 也 看 好 基因 。 因 为 在 算法 层面 上 ， 
进行 群体 的 “基因 编辑 ”都 是 相当 安全 且 无 伦理 问题 的 。 进 化 论 告诉 我 
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f]. 基因 的 演化 有 3 种 模式 : 复制 (reproduce), 46 X. (crossover) 和 变异 
(mutation )。 那 么 ， 如 果 要 “编辑 ”出 一 个 最 优 的 “基因 ”， 我 们 完全 可 以 
让 成 千 上 万 组 “基因 ”通过 这 3 种 方式 来 实现 优胜 劣 汰 ， 最 终 收敛 到 期 望 
的 解 。 不 过 需要 注意 的 是 , 在 演化 过 程 中 , 复制 是 根本 , 变异 只 能 偶尔 为 之 。 
这 种 基于 基因 群体 行为 的 方法 被 称 为 遗传 算法 ( genetic algorithm ) "°, 

不 仅 微 粒 和 基因 有 群体 行为 ， 甚 至 毫 无 生命 特征 的 钞票 也 有 人 观 
察 到 了 有 趣 的 群体 流通 行为 。2002 年 德国 物理 学 家 德 克 “' 布 岁 克 曼 ( Dirk 
Brockmann ) 发 现 ， 尽 管 在 绝 大 多 数 时 间 里 ， 钞 票 只 在 一 个 较 小 的 区 域 里 
交换 ， 但 是 仍 有 一 小 部 分 钞票 会 流通 到 较 远 的 地 方 ， 如 图 20.8 所 示 。 他 将 
这 种 流通 模式 称 为 列 维 飞行 模式 (Levy flight pattern )， 并 认为 其 流通 性 质 
表明 小 概率 的 事件 有 时 会 产生 较 大 的 影响 P091. 
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图 20.7 布朗 运动 中 的 随机 游 走 ， 运 图 20.8 列 维 飞 行 模式 ， 运 动 起 始点 
动 起 始点 为 (0，0 ) A (0, 0) 
与 图 20.7 相 比 ， 列 维 飞行 模式 范 
围 大 很 多 


不 论 采用 哪 种 方法 ， 从 本 质 上 都 有 一 个 隐 含 假设 在 其 中 。 即 认为 个 体 
的 活动 具有 随机 性 ， 但 纳入 群体 后 ， 最 终 这 种 局 部 或 个 体 的 随机 性 可 以 收 
敛 到 全 局 平衡 有 序 的 环境 。 基 于 这 一 假设 ， 以 上 提 及 的 非 人 智能 群体 智能 、 
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微观 群体 算法 和 遗传 算法 常 被 用 于 目标 的 寻 优 ， 目 的 是 为 了 帮助 需要 迭代 
求解 或 梯度 寻 优 的 算法 获得 最 优 解 。 需 要 注意 的 是 ， 由 于 这 类 算法 或 多 或 
少 都 带 有 比较 强 的 启发 式 ， 因 此 不 太 容易 找到 好 的 理论 性 证 明 ， 如 数学 家 
们 偏好 的 存在 性 、 收 敛 性 和 唯一 性 等 以 及 统计 学 家 偏好 的 泛 化 界 。 即 使 有 
一 些 理论 性 的 证 明 ， 也 只 是 在 给 了 较 多 假设 条 件 后 的 有 限 结论 。 尽 管 如 此 ， 
这 类 方法 在 工程 上 仍然 形成 了 不 少 好 的 应 用 成 果 。 

多 样 性 与 集成 学 习 

要 发 挥 群体 的 优势 ， 关 键 是 多 样 性 必 不 可 少 ， 因 为 差异 大 的 时 候 更 容 
易 形 成 互补 性 。 如 蚁 群 算法 中 常 假定 每 只 蚂蚁 具有 独特 的 个 性 。 不 仅 单个 
物种 内 部 有 互补 性 ， 跨 物种 间 也 存在 互补 性 ， 其 至 更 明显 。 比 如 两 种 能 独 
立 生存 的 生物 间 的 原始 协作 关系 (protocooperation， 也 有 称 为 cooperation 
或 mutualism， 中 文 译 为 共生 )， 可 以 保证 双方 通过 共生 都 能 获 利 。 图 20.9 
中 寄居 蟹 与 附着 于 寄居 和 蟹 匿 居 的 贝克 上 的 海 获 、 钙 鱼 利用 吸盘 附着 在 娑 鱼 
体 表 与 效 鱼 ， 都 是 这 类 原始 协作 关系 。 海 蓉 借 助 寄居 和 多、 钙 鱼 借助 效 鱼 扩 
大 了 活动 范围 和 竞 食 机 会 ， 反 过 来 海 纲 和 闭 鱼 又 分 别 给 寄居 蟹 和 鲫鱼 提供 
了 了 保护。 另外， 蚂蚁 与 蚜虫 也 是 共生 关系 。 蚂 蚁 从 蚜虫 那儿 获取 甜 的 凑 便 ， 
同时 也 为 蚜虫 提供 保护 。 除 了 共生 ， 还 有 对 一 方 有 利 ， 对 另 一 方 无 关 紧 要 
的 偏 利 共 生 ( commensalism )， 如 常 受 海 葵 保 护 的 双 锯 鱼 。 人 类 与 宠物 狗 的 
共生 也 比较 有 意思 。 人 从 宠物 狗 中 得 到 了 情感 的 奈 厌 ， 老 年 人 甚至 把 它 作 
为 已 自立 门户 的 子女 的 替代 品 。 而 宠物 狗 也 不 仅仅 是 得 到 食物 ， 还 从 人 类 
这 里 学 习 了 很 多 人 类 的 行为 规范 。 值 得 再 次 强调 的 是 ， 机 器 智能 目前 还 无 
法 替代 宠物 狗 的 共生 功能 。 而 在 人 工 智 能 领域 ， 也 有 不 少 研究 是 在 学 习 和 
利用 这 种 跨 物种 间 的 互补 性 ， 如 利用 地 面 机 器 人 与 无 人 机 的 互补 性 来 实现 
对 未 知 环境 的 快速 探 路 。 而 2017 年 中 国 国 务 院 出 台 的 《新 一 代 人 工 智能 发 
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展 规划 》 中 , 也 强调 了 要 着 重 研究 “多 人 多 机 联结 , 使 之 涌现 出 更 强大 智能 ” 
的 群体 智能 "7。 


A209 共生 
(a) SEA SX; (b) foe we 


在 通信 中 也 能 见 到 利用 多 样 性 和 互补 性 的 应 用 。 如 在 信道 的 误差 纠 
偏 中 ， 为 了 保证 信息 在 传输 中 不 发 生 错误 ， 最 简单 的 操作 就 是 多 传输 几 
次 。 尽 管 每 一 次 都 有 可 能 出 错 ， 但 只 要 出 错 的 位 置 不 同 ， 总 能 通过 少数 服 
从 多 数 的 方式 来 大 幅 降低 传输 犯错 的 概率 ， 最 大 程度 地 保证 信号 传输 的 正 
确 性 。 

机 器 学 习 界 把 利用 集体 或 群体 来 增强 性 能 的 策略 叫 作 集 成 学 习 
(ensemble learning )。 要 在 集成 框架 下 获得 好 的 性 能 ， 基 本 假设 是 每 个 子 体 
学 习 器 要 有 一 定 的 预测 能 力 ， 比 如 至 少 要 比 扔 硬币 随机 猜 的 性 能 好 一 点 ， 
同时 分 类 器 之 间 要 有 足够 大 的 多 样 性 或 差异 性 。 在 这 一 思想 下 ,大量 的 集 
成 学 习 方法 被 发 展 。 以 分 类 任务 如 人 脸 识 别 为 例 ， 早 期 端 对 端的 深度 学 习 
还 未 流行 时 ， 一 般 都 从 3 个 角度 来 实现 群体 的 集成 。 或 是 改变 输入 的 特征 ， 
形成 多 样 性 ; 或 是 变更 学 习 器 的 多 样 性 ; 或 是 变动 最 终 输出 函数 的 集成 方 
式 "9。 虽 然 基本 套路 并 不 复杂 ， 但 俗话 说 得 好 “三 个 臭 皮 匠 抵 个 诸葛 亮 ”。 
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在 2012 年 深度 学 习 没 有 形成 大 的 性 能 提升 前 ， 集 成 学 习 模 型 形成 的 群体 优 
势 几乎 是 打 遍 了 “所 有 与 数据 相关 的 竞赛 ”而 无 敌手 。 而 2012 年 后 ， 尽 管 
深度 学 习 成 为 主流 ， 但 仍然 能 见 到 集成 学 习 的 三 板 答 ， 有 些 是 转化 成 了 深 
度 学 习 中 网 络 的 结构 变化 ， 有 些 仍 是 通过 把 多 个 深度 模型 结合 来 继续 用 群 
体 优 势 拔 得 竞赛 的 头筹 。 

如 果 分 析 以 上 这 些 群 体 智 能 学 习 ， 就 会 发 现 这 些 群 体 算法 要 么 是 针对 
某 个 目标 的 优化 来 考虑 的 ， 要 么 是 针对 某 个 目标 的 预测 来 实施 的 。 研 究 非 
人 智能 体 的 群体 算法 时 ， 科 学 家 们 着 重 观察 的 现象 似乎 主要 与 其 群体 的 生 
存 密切 相关 。 反 观 人 类 ,在 成 为 地 球 主宰 后 ， 早 已 不 再 仅仅 满足 于 生存 需 
求 ， 还 衍生 了 生理 、 安 全 、 
社交 、 尊 重 和 自我 实现 共 5 
个 层次 的 需求 ， 被 称 为 马 斯 
洛 需 求 层 次 理论 。 对 于 艺术 
家 或 音乐 家 ， 还 存在 第 六 个 
层次 的 需求 ， 即 超 自 我 实现 。 
这 些 层 次 的 需求 ， 从 递 进 关 
系 上 看 很 像 是 一 个 金字 塔 ， 
或 者 说 是 需求 上 的 由 粗 到 细 
(图 20.10), 虽然 这 一 理论 存 
在 一 些 争 议 , 但 从 人 工 智能 
角度 来 看 ， 这 些 高 层次 的 需求 在 研究 群体 智能 时 是 值得 借鉴 的 。 

如 果 要 研究 人 工 智 能 ， 必 然 要 考虑 人 工 智能 体形 成 社会 和 群体 ， 而 非 
个 体 时 的 情况 。 那 我 们 不 妨 看 看 ， 人 类 智能 体 在 生存 需求 以 上 ， 和 群体 生活 
时 会 存在 哪些 错觉 。 如 果 人 工 智 能 体 希 望 模拟 人 的 群体 行为 ， 也 许 就 能 从 
这 些 错 觉 中 得 到 一 些 经 验 的 借鉴 。 


E2010 马 斯 洛 需求 层次 理论 
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群体 错觉 

一 旦 有 了 社会 , 生存 需求 就 退 居 二 线 了 。 此 时 的 群体 不 再 满足 于 以 “ 预 
测 ”为 终极 目标 的 ， 对 知识 的 渴求 会 逐渐 占 上 风 ， 尤 其 是 信息 量 大 的 知识 。 
比如 “太阳 从 东边 升 起 ”这 种 自然 规则 ， 按 概率 来 说 ， 就 是 百分之百 能 成 
立 的 。 然 而 它 却 是 没有 知识 含量 的 。 因 为 按 信 息 论 之 父 香农 的 定义 ， 信 息 
是 事件 出 现 概 率 的 倒数 的 负 对 数 比 。 简 单 来 说 ， 百 分 之 百出 现 的 ， 信 息 等 
于 0。 对 习惯 快 思维 的 人 类 来 说 , 这 类 信息 会 和 路 面 的 细节 一 样 被 直接 忽略 。 
如 果 事 件 出 现 的 概率 很 小 时 ， 反 而 蕴含 了 大 的 信息 量 。 比 如 马路 上 突然 有 
人 打架 ,于 是 路 人 们 会 一 拥 而 上 ， 观 战 、 拿 手机 拍照 发 朋友 圈 。 这 是 信息 
论 下 “对 知识 的 渴求 ”表现 出 来 的 群体 本 能 反应 。 

可 是 假如 不 是 打架 ， 而 是 刑事 案件 时 ,旁观 者 愿意 主动 施 救 的 反而 可 
能 变 少 ， 尤 其 是 在 人 来 人 往 的 场所 。 这 是 因为 当 在 场 的 人 太 多 时 ， 帮 助 的 
责任 就 被 大 家 平分 ， 平 分 到 连 旁观 者 都 意识 不 到 ， 以 至 于 给 人 造成 了 “ 集 
体 冷漠 ”的 感觉 。 这 不 是 信息 量 在 起 作用 ， 而 是 责任 分 散 效 应 的 群体 错觉 。 
“三 个 和 尚 ”故事 中 讲 的 “一 个 和 尚 挑 水 喝 ， 两 个 和 尚 抬 水 喝 ， 三 个 和 尚 没 
水 喝 "， 就 是 责任 分 散 效应 的 体现 。 

也 有 人 期 望 通过 群体 的 力量 获得 集成 学 习 般 的 性 能 提升 。 然 而 ,“ 物 以 
类 聚 、 人 以 群 分 "， 即 使 现代 社会 也 是 如 此 ， 如 朋友 圈 中 的 五 花 八 门 的 群 ， 
常 是 因 某 一 方面 的 共性 而 形成 的 群体 。 在 这 种 群体 时 ， 持 异 见 者 更 容易 被 
孤立 而 非 接纳 。 不 仅 群体 有 排斥 现象 ， 甚 至 有 时 还 会 有 智商 、 情 商 的 拉 低 
效应 。 比 如 参加 传销 团体 ， 人 会 不 由 自主 失去 自我 意识 ， 导 致 本 应 正常 的 
智商 无 法 表现 , 变 成 智力 水 平 低下 的 生物 。 这些 现象 是 群体 的 拉平 错觉 1。 

群体 智能 在 少数 服从 多 数 问 题 上 也 存在 误区 。 因 为 群体 经 常 表现 的 是 
普通 品质 ， 并 不 能 胜任 需要 很 高 智力 才能 完成 的 工作 "" ， 但 却 可 能 因 这 一 
规则 而 扼杀 智慧 。 比 如 在 早期 科学 还 处 在 启蒙 阶段 时 ， 哥 白 尼 因 坚持 日 心 
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说 而 被 教会 烧 死 ， 而 伽利略 为 了 保全 性 命 不 得 不 牺牲 掉 自 己 对 这 一 观点 的 
坚持 。 这 些 都 表明 多 数 投票 策略 可 能 存在 的 风险 ， 因 为 真理 并 一 定 都 掌握 
在 多 数 人 手 里 。 这 是 统计 中 在 缺乏 先 验 信息 时 ， 采 用 群体 平均 权重 引发 的 
错觉 。 

这 也 反映 了 另 一 个 现象 ,在 群体 社会 中 ,成 群 并非 对 所 有 人 都 是 最 优 
的 , 因为 “ 牛 羊 才 会 成 群 , 狮 虎 只 会 独行 "。 毕 淑敏 说 过 “孤独 是 一 种 兽性 ”。 
它 反映 了 独 来 独 往 的 自信 和 勇猛 。 适 当 享受 个 体 的 孤独 ， 还 能 更 有 效 地 管 
理 时 间 和 自由 地 探索 。 

群体 错觉 还 有 不 少 ， 在 社会 心理 学 方面 有 相当 多 的 研究 成 果 ， 它 间接 
或 直接 地 导致 了 社会 的 多 样 性 和 层次 性 。 这 些 是 我 们 在 研究 人 工 智能 群体 
行为 时 需要 注意 的 ， 也 是 人 工 智 能 体 未 来 形成 人 工 智能 社会 时 需要 考虑 的 。 

到 此 为 止 ， 我 已 经 从 诸多 层面 介绍 了 人 类 的 错觉 。 我 们 不 禁 要 问 ， 人 
类 如 此 爱 犯 错 ， 为 什么 还 能 主宰 世界 呢 ? 机 器 智能 会 替代 人 类 成 为 主宰 吗 ? 
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三 @ 平衡: 机 器 vs 智能 


一 个 明智 的 人 ， 仅 仅 自 己 研究 自然 和 真理 是 不 够 的 ， 他 
应 该 敢于 把 真理 说 出 来 ， 帮 助 少数 愿意 思想 并 且 能 够 思想 的 
A; 因为 其 余 甘心 作 偏见 的 奴隶 的 人 ， 要 他 们 接近 真理 ， 原 来 
不 比 要 蛤 晓 飞 上 天 更 容易 。 
一 一 引 自 拉 . Hew, (ARE) "m 
自然 界 总 是 存在 各 种 平衡 。 对 一 件 事 的 极致 追求 ， 往 往 需 要 用 另 一 件 
事 的 损失 来 偿还 。 比 如 ， 有 了 时 间 的 时 候 没 有 钱 ， 可 有 了 钱 又 没有 了 时 间 ， 
因为 “ 鱼 和 熊 掌 不 可 兼 得 ”。 
宇宙 万 物 ， 在 微观 层面 的 平衡 表现 为 量子 力学 中 的 不 确定 性 原理 ， 也 
称 为 测 不 准 原理 ， 是 测量 粒子 的 精确 位 置 与 精确 速度 上 的 不 可 兼 得 ， 它 保 
护 了 量子 力学 。 而 在 宇 观 ， 有 一 个 光速 不 变性 原理 ， 每 秒 30 万 千 米 的 速度 
限定 了 人 类 探索 宇宙 的 空间 范围 ， 它 同时 也 保护 了 宇宙 物理 学 。 那 人 工 智 
能 领域 里 的 平衡 、 研 究 方式 是 怎样 的 呢 ? 研究 现状 又 存在 哪些 瓶颈 呢 ? 我 
UA 5 点 展开 讨论 : 
(1) 人 工 智能 的 不 确定 性 原理 
(2 ) 由 粗 到 细 的 结构 发 育 
(3 ) 智能 测试 
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(4) 智能 测试 体 的 选择 与 伦理 
(5) 人 工 智能 困境 


人 工 智能 的 不 确定 性 原理 

人 工 智 能 领域 ， 有 几 个 与 物理 学 类 似 的 不 确定 性 原理 。 深 度 学 习 之 前 
曾 一 度 流行 的 稀 朴 学 习 理 论 里 ， 科 学 家 们 和 希望 通过 对 数据 特征 的 稀 琉 化 来 
获得 可 解释 性 。 但 是 ， 其 解释 性 的 代价 是 构造 了 有 具有 随机 性 、 稠 密 的 变换 
基 函 数 ， 如 高 斯 函数 。 这 一 思路 是 稀 玲 与 秽 密 、 时 间 与 空间 的 不 确定 性 。 
我 们 在 傅 里 叶 变 换 、 小 波 变 换 以 及 稀 疏 学 习 中 都 能 看 到 这 一 不 确定 性 原理 
的 影子 ， 时 间 域 细节 清晰 了 ， 频 率 域 就 稠密 ， 反 之 亦 然 。 但 这 种 不 确定 性 
原理 只 提供 了 寻找 可 解释 变量 的 方式 ， 能 处 理 的 变量 规模 相对 有 限 ， 对 智 
能 的 启示 还 不 明显 。 

另 一 个 是 模糊 理论 29 的 创始 人 、 加 州 大 学 
伯克利 分 校 的 拉 特 飞 . A. 扎 德 (Lotfi A. Zadeh, 
1921 一 2017) 教授 ( 图 21.1) 在 1972 年 提出 
的 、 解 释 复 杂 系 统 的 不 相 容 原理 (incompatibility 
theory ) "0。 他 认为 : 

“ 随 着 系统 复杂 性 的 增加 ， 我 们 对 其 特性 作出 
精确 而 有 显著 意义 的 描述 能 力 会 随 之 降低 ， 直 至 达 
到 一 个 阅 值 ， 一 旦 超过 它 ， 精 确 和 有 意义 二 者 就 会 ”图 21.1 dA du 
相互 排斥 。” 

不 相 容 原理 表明 ， 随 着 复杂 性 的 增加 ， 预 测 和 可 解释 性 之 间 将 存在 平 
衡 或 折 中 。 然 而 ， 纵 观 人 工 智能 的 发 展 史 ， 复 杂 性 的 定义 一 直 在 变迁 。 最 
早 复 杂 性 被 认为 是 模型 参数 的 数量 ， 后 又 被 视 为 神经 网 络 的 网 络 结构 复杂 
程度 。 统 计 学 习 理 论 提出 后 , 在 分 类 问题 上 又 转 为 "能 分 类 任意 数据 组 合 的 ” 
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模型 划分 能 力 "52。 值 得 指出 的 是 ， 这 种 划分 能 力 并 不 与 参数 个 数 成 线性 关 
系 的 ， 有 可 能 一 个 参数 也 具有 无 穷 大 的 划分 能 力 。 结 果 ， 单 从 复杂 性 的 角 
度 来 度量 这 种 平衡 或 刻画 不 确定 性 ， 尽 管 直观 ,但 还 存在 复杂 性 不 容易 确 
定 的 问题 。 

我 在 《深度 学 习 , 你 就 是 那 位 116 岁 的 长 寿 老奶奶 ! 六 详 见 本 书 附录 一 ) 
中 指出 过 ， 可 解释 性 和 可 预测 性 之 间 存 在 着 平衡 ， 因 为 它 是 统计 和 个 体 之 
间 的 平衡 。 要 追求 预测 性 能 ， 总 可 以 找到 不 具 统计 解释 但 却 性 能 优异 的 个 
体 ， 而 统计 往往 又 会 因为 平均 而 牺牲 个 体 的 优异 性 能 。 这 是 统计 和 个 体形 
成 的 预测 与 可 解释 性 之 间 的 不 确定 性 ， 姑 且 将 其 称 为 “ 平 猫 不 确定 原理 ”。 

如 果 令 模型 的 预测 了 与 最 优 预 测 P^ 之 间 的 绝对 值 差异 为 AP=|P-P'|， 
令 模 型 的 可 解释 性 7 与 最 优 的 可 解释 性 7" 之 间 差 的 绝对 值 差 异 为 AA", 
令 C 是 一 个 足够 小 的 常数 , 则 会 存在 一 个 预测 和 可 解释 之 间 的 不 确定 性 , 即 : 

AP AIZC 

前 者 可 以 通过 对 个 体 性 能 的 追逐 获得 足够 近 的 小 值 ， 而 后 者 可 以 通过 
对 平均 性 能 的 追逐 获得 足够 近 的 小 值 ， 但 两 者 之 间 存 在 折 中 ,不 可 兼 得 。 

而 现 阶 段 我 们 对 可 预测 性 的 追求 更 多 一 些 ， 因 为 它 与 工业 界 关注 的 性 
能 密切 相关 ， 能 够 直接 带 来 GDP? 的 产 出 ， 也 是 引发 了 第 三 波 人 工 智能 热 
潮 的 主要 原因 。 但 是 ， 只 追求 预测 性 能 ， 会 使 得 其 更 像 是 机 器 ， 更 像 人 工 
智能 领域 的 “飞机 "， 而 离 “ 具 有 与 人 和 其 他 非 人 智能 相似 且 不 可 区 分 的 智 
能 ” 仍 存在 不 小 的 距离 。 

如 果 我 们 想 要 构造 具有 这 种 折 中 或 平衡 智能 ， 有 没有 可 行 的 路 呢 ? 


由 粗 到 细 的 结构 发 育 
除了 宇宙 可 能 是 从 零 开 始 的 以 外 ， 没 有 什么 其 他 东西 是 平 白 无 故 产生 


@ GDP: gross domestic product， 国 民生 产 总 值 。 
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的 。 人 的 智能 从 胚胎 发 育 开 始 ， 然 后 有 了 视觉 、 听 觉 、 触 觉 等 感官 和 身体 
器 官 的 发 育 ， 并 最 终 有 了 智能 体 的 形态 。 表 经 过 漫长 的 儿童 期 和 教育 ,和 
能 才 得 以 逐渐 完善 。 在 这 一 过 程 中 ， 人 类 的 智能 经 历 了 由 粗 到 细 的 结构 变 
化 ， 而 平衡 智能 似乎 就 隐藏 在 其 中 。 

C1) 人 在 思维 中 , 存在 快 思 维 与 慢 思 维 两 种 方式 ， 常 以 快 思维 为 主办。 
而 人 对 快 思 维 的 频繁 使 用 应 该 与 最 初 的 粗糙 或 粗略 学 习 有 密切 关系 。 试 想 ， 
人 在 走路 的 时 候 ， 有 谁 会 关注 路 面 的 纹理 细节 呢 ? 即使 是 人 的 身份 识别 ， 
早期 儿童 心理 学 发 现 ， 小 孩 往往 更 容易 记 住 父母 而 非 陌 生 人 。 但 如 果 母 亲 
用 帽子 将 其 轮廓 遮挡 后 ， 小 孩 会 出 现 短 时 的 认 知 障碍 。 这 些 都 表明 ， 粗 略 
式 的 学 习 和 记忆 是 早期 智能 发 育 的 基础 ， 因 为 它 可 以 让 人 类 更 快速 地 了 解 
环境 和 目标 。 在 保证 足够 预测 精度 的 同时 ， 节 省 了 大 量 的 计算 资源 和 耗 能 。 

(2 ) 这 种 粗放 式 的 认 知 模式 可 能 被 固化 到 后 期 的 认 知 中 ， 对 快 思维 的 
形成 起 了 关键 作用 。 值 得 注意 的 是 ,并非 只 有 人 类 才 有 这 种 快 思维 。 非 人 
的 动物 或 智能 体 都 具备 。 如 果 观 察 宠 物 狗 或 其 他 动物 的 走路 行为 ， 就 会 发 
现 它们 并 不 会 像 机 器 人 那样 对 路 面 做 仔细 的 辨识 。 这 表明 ， 在 常识 智能 
面 人 和 其 他 非 人 智能 体 有 近似 的 结构 发 育 方式 。 

(3) 我 们 也 可 以 推测 ， 这 种 近似 的 发 育 模式 是 被 腻 套 在 基因 里 ， 通 过 
遗传 完成 的 。 所 以 ， 似 乎 人 类 和 非 人 智能 体 最 初 的 学 习 模 式 ， 甚 至 于 情感 
的 表达 方式 并 不 全 是 主动 完成 的 ， 而 是 被 基因 编码 所 诱导 的 。 从 这 个 角度 
来 看 ， 人 和 非 人 智能 体 似乎 就 是 一 台 机 器 。 那 么 ， 弄 明白 基因 的 这 种 按时 
表达 ， 也 许 对 于 理解 智能 的 发 育 和 建构 很 关键 ， 甚 至 有 可 能 在 未 来 改变 智 
能 体 的 学 习 模 式 。 但 人 又 不 完全 是 机 器 ， 因 为 人 类 在 漫长 的 演化 中 ， 引 入 
了 漫长 的 儿童 期 、 独 特 的 教育 和 语言 ， 并 通过 群体 的 交互 保证 了 种 族 的 稳 
定 和 繁衍 。 

(4) 如 果 以 上 推测 是 合理 的 ， 那么 结构 的 表达 大 概 是 怎样 一 个 次 序 
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WE? 首先 ， 对 于 正常 发 育 的 人 来 说 ， 视 觉 应 该 是 最 重要 和 优先 发 育 的 ， 
然后 才 是 其 他 辅助 的 感觉 器 官 的 发 育 。 因 为 视觉 本 是 从 大 脑 发 育 中 分 离 
出 来 的 ， 它 可 以 视 为 大 脑 的 一 部 分 。 其 次 ， 当 具体 概念 得 到 由 粗 到 细 的 
认 知 后 ， 才 开始 建构 更 抽象 的 语言 。 即 使 是 情感 的 建立 ， 也 是 从 直觉 式 
的 情感 开始 ， 然 后 才 有 更 细腻 的 、 被 修饰 了 的 理性 情感 。 在 其 他 认 知 能 
IE, 发 育 的 模式 应 是 类 
似 的 ， 其 建构 非常 像 我 们 
常 说 的 金字 塔 ( 图 21.2 )。 
如 果 在 研究 人 工 智能 的 过 
程 中 ， 本 末 倒 置地 去 建构 
人 工 智 能 体 ， 比 如 重点 关 
注 抽象 的 、 如 自然 语言 的 
结构 分 析 ， 而 不 给 其 提供 
视觉 或 其 他 感觉 器 官 的 发 
育 研究 成 果 作为 支撑 ， 很 
有 可 能 研究 出 来 的 是 缺乏 真正 智能 的 机 器 。 

C5) 不 仅 在 具体 到 抽象 中 存在 金字 塔 式 的 由 粗 到 细 的 认 知 结构 ， 在 每 
个 层次 ， 如 视觉 、 听 觉 ， 甚 至 精神 需求 等 也 应 有 类 似 的 层级 结构 。 智 能 体 在 
使 用 这 些 结构 时 ， 能 自 适应 地 按 需 选择 是 用 粗糙 还 是 精细 ， 或 者 两 者 折 中 
的 模型 来 完成 推理 、 预 测 等 认 知 任务 ， 以 获得 在 快 思 维和 慢 思 维 间 的 平衡 
智能 。 


智能 测试 


A212 ”埃及 金字 塔 


假定 若干 年 后 ， 人 造 的 智能 体 具备 了 由 粗 到 细 、 人 金字 塔 式 的 结构 ， 那 
如 何 判定 其 是 否 具 有 智能 呢 ? 不 妨 回 看 一 下 经 典 的 、 一 正 一 反 的 两 个 智能 
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测试 方案 。 
在 人 工 智 能 领域 ， 图 灵 


ET B 
测试 是 最 经 典 的 智能 测试 方案 四 = » 


(图 21.3 )， 它 由 艾 伦 :图 灵 (Alan SS 


Turing ) 在 1950 年 的 论文 《计算 = — 
机 器 与 智能 》 中 提出 ma。 他 设想 
了 一 种 环境 ， 在 测试 者 与 被 测试 - 

者 隔 开 的 情况 下 ， 测 试 者 通过 革 e 

种 设备 如 键盘 向 被 测试 者 随意 提 H213 ARAA 


问 。 经 过 多 次 测试 后 ， 如 果 超 过 30% 的 测试 者 不 能 确定 被 测试 者 是 人 还 是 
机 器 ,那么 这 台 机 器 就 通过 了 测试 ， 并 被 认为 具有 与 人 类 相仿 的 智能 。 

自 此 以 后 ,不 计 其 数 的 科研 人 员 设 计 了 各 种 程序 ， 希望 能 通过 图 灵 测 
试 ， 以 证 明 其 能 达到 其 至 超越 人 类 的 智能 。 然 而， 情况 并 没有 想象 的 乐观 。 
事实 上 ，30% 的 指标 ， 还 是 图 灵 当 年 基于 对 人 工 智 能 前 景 看 好 ， 预 测 在 
2000 年 就 能 实现 的 。 但 现在 看 来 ,我们 离 这 一 目标 还 有 不 小 的 距离 。 

除 此 以 外 ， 图 灵 测 试 里 设置 的 提问 环节 ， 或 多 或 少 都 假定 了 机 器 和 智 
能 体 具 备 了 高 层 或 抽象 智能 。 因 此 自 其 测试 被 提出 后 , 人 类 对 问题 回答 ( 俗 
BR Q/A ) 的 研究 一 直 长 盛 不 误 。 但 是 ， 这 一 测试 并 没有 涉及 常识 智能 甚至 
情感 的 鉴别 。 而 从 结构 发 育 的 角度 来 看 ， 如 果 要 建构 智能 体 ， 这 两 者 的 鉴 
别 尤 其 重要 。 

另 一 个 有 名 的 测试 是 中 文 房 间 (Chinese room， 或 称 为 the Chinese 
room argument )， 如 图 21.4。 它 由 美国 哲学 家 约翰 : 希 尔 勒 (John Searle ) 
在 1980 年 提出 "I。 在 中 文 房 间 的 测试 中 , 希 尔 勒 假定 了 有 个 完全 不 会 说 
中 文 、 只 能 说 英文 的 人 在 一 间 房 里 。 房 间 除 了 门 和 一 个 小 窗口 ， 其 余 全 
封闭 。 不 过 ， 他 随身 带 了 本 具有 中 文 翻译 能 力 或 程序 的 书 ， 房 间 里 还 有 足 
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够 的 纸 、 笔 和 柜子 。 测 试 者 将 中 文 纸 条 通过 窗口 递 进 房间 ， 而 屋 里 的 人 可 
使 用 他 的 书 来 翻译 并 以 中 文 回复 。 尽 管 完 全 不 懂 中 文 ， 但 却 可 以 让 房间 外 
的 人 以 为 他 是 会 说 流利 中 文 的 。 


TÈ BAR ef 
AKA 一 定性 中。 


[Whoever or whatever is in that room 
is an intelligent Chinese speaker!] 


A214 中 文 房 间 


这 个 测试 表明 ， 即 使 房间 里 的 人 对 中 文 一 窍 不 通 ， 但 仍然 可 以 通过 运 
行 翻译 程序 来 骗 过 测试 者 ， 让 测试 者 对 机 器 产生 智能 的 印象 。 与 图 灵 测 试 
不 同 ， 中 文 房 间 是 希望 推翻 人 工 智 能 对 “智能 ”的 定义 ， 即 “只 要 计算 机 
设计 好 适当 的 程序 ， 理 论 上 来 说 ， 就 可 以 认为 计算 机 拥有 了 它 的 认 知 状态 ， 
并 且 能 像 人 一 样 进行 理解 活动 ”。 

从 中 文 房 间 的 测试 不 难 发 现 ， 它 主要 质疑 的 是 预测 行为 与 智能 的 等 价 
性 。 但 是 ， 智 能 不 仅仅 只 是 预测 。 因 此 ， 我 们 应 该 要 在 比 预测 更 宽泛 的 定 
义 和 环 境 下 测试 智能 。 

另外 ， 这 两 个 测试 都 采取 了 隔离 ， 它 迫使 测试 不 得 不 借助 高 层 的 抽 
象 智能 如 语言 来 完成 交互 。 其 次 ， 这 两 个 测试 似乎 都 假定 了 与 人 的 智能 的 
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iiy. 

回 看 本 书 中 介绍 的 犯错 机 制 和 常识 智能 等 ， 可 以 发 现 常识 智能 、 犯 错 
都 是 智能 体 中 必然 存在 的 。 尤 其 是 犯错 机 制 ， 从 某 种 意义 来 说 ， 它 是 使 得 
智能 体 世界 具有 多 样 性 的 原因 之 一 ， 也 是 有 群体 存在 的 前 提 之 一 。 所 以 ， 
智能 测试 应 该 不 限定 于 抽象 智能 ， 更 应 该 包含 常识 智能 和 对 犯错 情况 的 一 
般 性 测试 。 

另外 ， 其 他 非 人 智能 体 同 样 具 备 了 一 些 基 本 的 智能 ， 包 括 情感 智能 、 
快 思维 方式 和 慢 思维 方式 。 更 何况 ， 如 果 没 有 语言 和 工具 的 引入 ， 人 在 自 
然 界 的 进化 中 , 本 属于 极 易 被 淘汰 的 一 种 生物 。 

因此 ， 采 用 更 一 般 性 的 智能 测试 条 件 : 开放 环境 、 不 限定 人 的 智能 模 
拟 ， 是 评测 智能 有 无 的 关键 。 

基于 这 些 考虑 ， 这 里 提出 一 个 也 许可 以 合理 检验 是 否 具 有 智能 的 方案 ， 
姑且 称 为 “ 平 猫 测试 ”: 

将 一 个 机 器 猫 (也 可 以 是 其 他 任意 形态 ) 放 在 透明 的 盒子 里 或 开放 环 
境 里 ， 测 试 者 可 以 与 它 交 互 ， 可 以 观察 、 分 析 它 的 行为 。 在 确信 它 的 预测 
能 力 足 够 好 的 前 提 下 ， 如 果 它 的 犯错 程度 是 可 接受 的 ， 情 绪 表 达 、 自 我 意 
识 会 让 超过 一 定 比例 (如 30% ) 的 测试 者 感觉 与 人 或 非 人 智能 体 相差 无 几时 ， 
则 可 以 认为 它 具有 智能 。 

只 要 它 满足 了 以 上 条 件 ， 我们 就 可 以 认为 它 是 智能 体 。 注 意 ， 这 里 是 
不 要 求 其 具有 任何 我 们 已 知 的 智能 体形 态 。 但 要 通过 测试 ,测试 者 需要 确 
言 这 只 机 器 猫 有 智能 体 该 具备 的 某 种 平衡 。 如 果 只 是 预测 能 力 方面 有 异常 
优异 的 表现 ， 而 对 其 他 智能 相关 的 指标 牺牲 过 大 时 ， 不 能 认为 其 具有 智能 ， 
而 只 能 认为 是 具有 机 器 的 预测 能 力 。 

要 构建 能 通过 这 一 测试 的 智能 体 ， 我 们 必须 在 有 智能 体形 态 的 智能 体 
上 寻找 线索 。 那 么 ， 在 哪里 找 呢 ? 
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智能 测试 体 的 选择 与 伦理 

谈 人 工 智能 的 终极 目标 ， 一 般 我 们 认为 是 可 能 制造 出 真正 能 推理 和 解 
决 问题 的 智能 机 器 。 并 且 ， 这 样 的 机 器 能 被 认为 是 有 知觉 、 有 自我 意识 的 。 
因为 这 样 的 定义 ， 多 数 人 工 智能 研究 者 会 将 其 向 人 的 智能 看 齐 ， 需 要 研究 
人 或 像 人 的 生命 体 的 智能 发 育 。 这 自然 会 带 来 比较 严重 的 伦理 问题 ， 因 为 
研究 人 的 智能 途径 之 一 是 要 对 人 的 大 脑 中 进行 深层 次 的 探索 。 但 不 管 是 脑 
电极 形式 还 是 基于 磁 共 振 的 方式 ， 都 或 多 或 少 会 损害 人 脑 的 神经 元 。 这 是 
大 家 不 愿意 涉及 这 类 人 工 智能 研究 的 原因 之 一 。 

当然 ， 退 而 求 其 次 似乎 更 合理 。 于 是 ， 科 研 人 员 选 择 了 与 人 类 在 形态 
上 最 为 接近 的 猴子 和 猩猩 来 做 实验 。 不 管 是 手势 的 使 用 ， 还 是 对 语言 的 理 
解 ， 似 乎 都 有 一 些 相似 之 处 ， 选 择 它们 似乎 是 最 佳 选择 。 为 了 人 类 的 未 来 ， 
它们 做 些 牺牲 也 无 可 厚 非 。 所 以 ， 在 这 两 类 动物 上 进行 的 很 多 实验 ， 经 常 
能 看 到 要 么 把 猴子 关 在 笼子 里 ， 要 么 开 颅 搬 好 电极 固定 在 架子 上 ， 测 试 其 
对 各 项 指令 的 反应 程度 ， 试 图 发 现 脑 区 活动 与 智能 的 线索 。 

然而 ， 这 也 许 并 非 是 现 阶段 研究 智能 最 有 效 的 方式 ， 也 可 能 并 非 是 最 
好 的 实验 品 。 因 为 成 本 太 贵 ， 能 用 猴子 、 猩 猩 做 实验 的 实验 室 可 以 说 都 是 
非 富 即 贵 的 。 所 以 ， 才 会 有 研究 人 员 宁 愿 直接 在 人 身上 做 相关 测验 ， 因 为 
可 能 更 经 济 。 实 际 上 ， 真正 与 人 类 有 良好 情感 交互 的 ,不 是 猴子 、 猩 猩 ， 
而 是 宠物 狗 。 经 过 几 千 年 的 驯服 ， 狗 早已 经 能 够 非常 好 地 理解 人 类 的 情感 ， 
甚至 部 分 语言 。 从 常识 智能 和 基本 情感 来 看 ， 狗 已 经 具备 了 和 人 类 几乎 一 
样 的 能 力 。 更 何况 ， 狗 的 数量 远 多 于 猴子 、 猩 猩 ， 且 不 存在 不 可 逾越 的 伦 
理 问 题 。 

事实 上 ， 如 果 不 是 因为 语言 和 教育 ， 人 类 在 自然 界 的 位 置 应 该 是 属于 
弱小 的 行列 ， 基 至 在 很 多 方面 并 不 比 其 他 动物 具有 优势 。 我 们 现在 有 时 却 
有 意 无 意 地 避 开 这 些 劣势 不 谈 ， 而 去 着 重 研究 人 类 的 高 层 能 力 ''。 从 某 种 
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意义 上 来 看 ， 这 样 的 处 理 有 可 能 不 利于 打开 真正 通 向 智能 的 门 。 

所 以 ,综合 这 些 信息 ， 从 这 个 角度 出 发 ,我 们 并 不 需要 把 研究 的 测试 
体 限定 在 人 和 猴子 、 猩 猩 上 ， 而 是 有 着 大 量 可 供 选 择 的 测试 体 ， 来 帮助 我 
们 理解 目前 还 不 太 明 了 的 常识 智能 和 情感 。 

然而 ， 即 使 提供 了 大 量 的 测试 体 ， 现 阶段 着 手 研 究 人 工 智 能 的 终极 目 
标 也 并 非 是 一 趴 而 就 、 水 到 渠 成 的 ， 因 为 我 们 还 处 在 人 工 智 能 的 困境 中 。 

人 工 智 能 困境 

在 这 一 波 人 工 智 能 热潮 中 ， 有 相当 多 的 学 科 都 投入 了 人 工 智 能 的 研究 
中 。 尽 管 产业 界 形成 了 显著 的 进展 ， 尤 其 在 安防 相关 的 行业 ， 也 有 通过 网 
灵 测 试 的 所 谓 报 道 ， 但 我 们 似乎 并 没有 看 到 多 少 与 真正 智能 相关 的 影子 ， 
困难 主要 在 哪里 呢 ? 这 里 从 几 个 主要 方面 谈 些 自己 粗浅 的 观点 , 希望 能 给 
大 家 一 些 思考 和 线索 : 

1. 机 器 学 习 

在 本 轮 人 工 智 能 热潮 中 ， 最 亮 眼 的 主角 无 疑 是 深度 学 习 或 更 宽泛 一 些 
的 机 咒 学 习 。 它 对 于 人 工 智能 以 及 在 产业 界 的 应 用 的 推动 是 显而易见 的 。 
然而 ， 机 器 学 习 是 否 真 能 帮助 理解 真正 的 智能 呢 ? 

我 们 不 妨 将 机 器 学 习 的 技术 简化 成 “ 程 咬 金 的 三 板 人 答 ”: 正则 化 、 加 圈 、 
加 层 ， 这 样 也 许 会 比较 容易 理 清 头绪 ， 尽 管 在 这 一 领域 上 还 有 很 多 其 他 值 
得 列举 的 研究 成 果 。 

第 一 板 从 是 正则 化 ， 其 观点 认为 我 们 要 研究 的 问题 求解 不 存在 唯一 性 ， 
往往 是 一 对 多 的 求解 。 吉 洪 诺 夫 (Tikhonov ) 将 其 称 为 病态 问题 ( ill-posed 
problem ) 1。 要 让 病态 问题 良 态 化 ， 最 自然 的 做 法 就 是 引入 约束 项 或 正 
则 化 项 。 从 病态 问题 良 态 化 的 思想 提出 至 今 ， 这 一 板 稳 挥 了 60 多 年 ， 随 着 
对 数据 结构 持续 不 断 、 更 新 的 认识 ,我 们 提出 了 各 种 正则 化 的 方案 ， 从 模 
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型 参数 的 复杂 性 到 空间 的 光滑 性 ， 到 模型 结构 的 复杂 性 ， 到 特征 的 稀 玻 性 ， 
诸如 此 类 。 但 似乎 这 些 努力 最 终 都 转化 为 预测 任务 ， 而 并 没有 对 智能 给 出 
更 明晰 的 解答 。 可 能 的 原因 是 : 如 果 给 定 了 一 个 限定 体积 的 球 作 为 搜索 空 
间 ， 那 能 寻找 的 解 空 间 必 然 只 能 在 此 球 内 去 找 。 不 管 增加 多 少 的 约束 项 来 
使 问题 良 态 化， 该 良 态 化 获得 的 全 局 最 优 解 也 只 能 是 这 个 球 张 成 的 解 空间 
上 的 局 部 最 优 。 可 是 ， 如 果 一 开始 球 就 给 错 了 呢 ?” 如 果 这 个 球 只 相当 于 盲 
人 摸 象 中 摸 的 其 中 一 条 腿 呢 ? 

第 二 板 丛 是 加 圈 ， 其 主要 思想 是 假定 观测 到 的 世界 变迁 可 能 由 一 个 或 
多 个 小 人 在 暗中 控制 ， 且 这 些 变 迁 的 变量 和 小 人 之 间 存 在 较 复杂 的 相互 关 
系 ， 由 此 我 们 可 以 构造 有 明确 指向 关系 的 有 向 图 模型 ， 或 者 是 无 明确 指向 
的 无 向 图 模型 ， 当 然 也 可 以 混搭 。 这 一 板斧 的 优势 在 于 方便 解释 ， 因 为 关 
系 都 是 明确 的 。 要 丰富 对 世界 各 个 侧面 的 理解 ， 最 自然 的 做 法 就 是 增加 能 
描述 更 细 粒 度 关系 的 圈 以 及 圈 与 圈 的 边 了 。 但 这 一 方法 在 变量 过 于 复杂 时 ， 
又 容易 出 现 关系 混乱 、 计 算 量 过 大 的 问题 ， 在 现 阶段 也 很 难 构造 出 可 以 自 
我 生长 的 模型 。 

第 三 板斧 是 深度 学 习 的 加 层 。 既 可 以 往 深 了 加 ， 也 可 以 往 宽 了 加 ， 还 
可 以 跳 着 (skip-connection ) 加 ， 还 可 以 有 注意 力 的 (attentive ) 加 ， 只 要 
你 想得到 就 行 。 加 层 的 历史 按 性 能 的 改善 可 以 分 两 阶段 ， 相 对 浅 层 的 经 典 
神经 网 络 时 代 和 2012 年 深层 的 后 神经 网 络 时 代 。 尽 管 有 两 个 时 代 ， 从 理论 
方面 来 看 ， 他 的 变化 却 并 不 大 。 但 从 工程 技巧 来 看 ， 逐 层 变 特征 学 习 的 策 
略 让 其 获得 了 巨大 的 可 寻 优 空间 ， 再 加 上 大 数据 的 支持 ， 使 得 其 在 预测 能 
力 相 关 的 任务 中 ， 目 前 处 于 独孤 求 败 的 地 位 。 其 他 门派 只 能 在 小 样本 环境 
中 找 点 自留地 。 但 是 ,( 深度 ) 神经 网 络 模型 从 多 层 感知 机 模型 开始 ， 到 非 
线性 变换 函数 的 引入 、 反 向 传播 算法 的 提出 、 深 层 结构 的 发 展 ， 这 一 结构 
的 主要 长 处 还 是 预测 ， 因 为 有 广义 允 近 定理 的 支持 。 它 并 没有 考虑 模型 的 
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可 塑性 、 可 发 育 性 ， 也 没有 和 触及 本 文中 提 及 的 智能 所 需要 的 平衡 。 

因为 预测 是 机 器 学 习 的 重 中 之 重 ， 所 以 ， 我 们 在 此 框架 下 确实 看 到 了 
不 少 人 工 智能 方面 的 成 就 。 但 是 ， 在 探索 “不 可 区 分 ”的 智能 方面 ， 机 器 
学 习 还 缺乏 相关 的 理论 支持 。 

2. 脑 科学 

与 机 器 学 习 主 战场 在 预测 不 同 ， 脑 科学 更 关注 大 脑 的 发 育 以 及 与 智 
能 的 关系 。 近 几 十 年 来 ， 脑 科学 在 微观 层面 ， 已 经 进入 了 细胞 、 分 子 水 
平 ; 在 宏观 层面 ， 随 着 各 种 无 创伤 脑 成 像 技 术 的 使 用 ， 如 正 电子 发 射 断 层 
扫描 术 、 功 能 性 磁 共 振 成 像 技 术 、 多 导 程 脑 电 图 记录 术 和 经 颅 磁 刺激 术 
等 的 使 用 , 已 经 可 以 对 不 同 脑 区 数 以 万 计 的 神经 元 的 活动 与 变化 进行 有 效 
4ypr a, 

然而 ， 由 于 目前 各 种 探测 技术 在 空间 和 时 间 两 方面 的 成 像 分 辨 率 都 并 
不 理想 ,我 们 的 分 析 仍然 是 雾 里 看 花 的 方式 。 尽 管 这 种 探测 方式 远 比 19 tit 
纪 初 曾 盛行 的 “ 颅 相 学 ”科学 多 了 ， 但 我 们 对 神经 元 集群 每 个 单元 的 活动 
仍 知之 甚 少 ， 更 不 用 说 ， 将 单元 的 信息 组 合 起 来 理解 大 脑 对 知识 、 信 息 的 
加 工 和 编码 过 程 呈 9。 其 次 ， 现 在 的 研究 对 大 脑 中 的 意识 也 缺乏 有 效 的 了 解 
办 法 。 比 如 ， 尽 管 我 在 前 文中 提 到 过 梦境 的 复述 方法 ， 但 仍 没有 办 法 能 真 
正 复 现 大 脑 在 梦境 中 的 场景 和 故事 。 另 外 ， 如 何 从 简单 的 神经 活动 升华 为 
我 们 平日 思考 所 用 的 快 思 维 、 慢 思维 ， 也 都 还 缺少 有 效 的 研究 方案 。 不 仅 
如 此 ， 如 果 从 机 器 学 习 的 角度 来 看 ， 由 于 脑 的 活动 都 是 个 体 的 ， 脑 科学 中 
诸多 实验 的 可 重复 性 都 偏 低 ， 难 以 形成 有 统计 意义 的 结论 。 基 于 以 上 原因 ， 
如 果 用 唯物 主义 的 方法 来 归纳 脑 科学 的 情况 ， 那 就 是 : 我 们 已 有 一 些 条 件 
来 理解 脑 活 动 中 量变 的 过 程 ， 却 还 不 明了 什么 时 候 量变 会 引起 质变 。 

3. 统计 学 

统计 学 对 人 工 智能 贡献 最 大 的 ， 当 属 频率 派 和 贝 叶 斯 两 大 流派 ， 主 要 
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不 同 在 于 要 不 要 利用 先 验 信 息 。 比 如 每 一 次 买 彩票 的 情况 就 可 以 看 成 是 下 
一 次 彩票 时 可 用 的 先 验 信 息 。 

自 英国 学 者 贝 叶 斯 发 表 了 “ 论 有 关机 遇 问 题 的 求解 ”一 文 并 提出 了 贝 
叶 斯 公式 后 ， 就 有 了 贝 叶 斯 学 派 。 该 学 派 认为 任何 一 个 未 知 量 都 可 以 通过 
重复 实验 的 方式 来 获得 一 个 先 验 的 分 布 ， 并 以 之 来 影响 总 体 分 布 和 推断 。 
而 在 贝 叶 斯 学 派 形 成 之 前 ， 曾 经 一 统 江湖 的 频率 学 派 从 来 就 是 立场 坚定 反 
对 这 种 特别 带 主观 性 质 的 做 法 。 当 两 大 门派 形成 后 ， 便 为 了 主观 还 是 客观 
描述 未 知 量 ， 有 了 一 场 吵 了 近 250 年 ， 至 今 还 在 吵 的 架 UL 

另外 ,为 了 追求 可 分 析 ， 统计 学 界 偏好 采用 线性 模型 求解 ， 以 便 获得 
相对 干净 的 答案 。 但 是 ， 现 实 世 界 却 存在 大 量 的 非 线 性 问题 。 

所 以 ， 不 管 两 个 学 派 谁 对 谁 错 ， 要 研究 真正 的 智能 、 寻 找 可 解释 性 的 
线索 ， 就 需要 统计 学 的 这 两 个 学 派 能 提供 更 多 有 效 的 、 非 线性 的 理论 、 方 
法 和 工具 。 

4. 数学 

对 我 来 说 ， 数 学 是 最 美丽 的 ， 几 千年 的 努力 已 经 让 其 成 为 了 人 类 历史 
上 最 完备 的 学 科 ， 没 有 之 一 。 数 学 之 美 在 于 简洁 ， 往 往 一 两 个 公式 、 一 个 
定理 就 能 把 连篇 累计 的 内 容 讲 清楚 。 然 后 ， 这 种 简洁 和 完备 性 的 获得 也 是 
有 代价 的 ， 很 多 时 候 是 通过 大 量 放 缩 、 牺 牲 小 项 来 得 到 的 。 而 研究 人 工 智 
能 ， 在 达到 一 定 预 测 性 能 后 ， 我 们 需要 了 解 的 ， 也 许 就 是 这 些 在 放 缩 过 程 
中 被 牺牲 掉 的 小 项 。 因 为 我 们 在 处 理 实际 问题 时 ， 大 多 数 情况 是 有 噪声 的 ， 
不 确定 性 的 。 

另外 ， 我 们 也 需要 思考 一 个 问题 : 智能 是 否 需 要 严谨 的 数学 ? 也 许 并 
不 要 ! 如 果 我 们 将 智能 狭义 地 理解 为 人 类 的 高 级 智能 的 话 ， 那 是 必须 的 。 
但 这 也 只 是 在 需要 进行 严密 思维 、 慢 思维 的 时 候 才 用 得 到 。 大 部 分 的 常识 
智能 是 不 依赖 于 这 类 高 级 智能 ， 即 不 需要 进行 太 多 的 数学 关联 ， 就 能 形成 。 
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比如 大 自然 中 的 绝 大 多 数 动物 ， 哪 种 动物 会 像 人 一 样 学 过 数学 ”可 为 什么 
仍然 能 很 好 地 适应 环境 ? 这 说 明 我 们 在 仿生 智能 时 ， 从 数学 上 建 模 可 能 并 
不 见得 是 等 同 于 真正 智能 的 感知 和 预测 模式 。 

5. 物理 学 

谈 到 物理 学 与 人 工 智能 ， 必 须 提 一 下 波动 力学 之 父 、 曾 提出 过 “ 薛 定 
pea” FEE ( 图 21.5 ) 的 奥地利 物理 学 家 埃 尔 温 ' PR REPS. WF 1944 年 出 
版 的 书 《 生 命 是 什么 一 一 活 细胞 的 物理 学 观 》 开 启 了 分 子 生物 学 的 大 门 ， 
也 有 说 其 对 人 工 智能 的 早期 发 展 起 了 重要 作用 。 他 认为 物理 学 和 化 学 原则 
有 助 于 解释 生命 现象 ， 而 基因 的 持久 和 遗传 模式 的 稳定 可 以 用 量子 理论 来 
说 明 。 该 书 也 促使 英国 物理 学 家 克 里 克 从 粒子 物理 的 研究 转行 到 生物 学 ， 
并 与 美国 生物 学 家 沃 森 一 起 在 1953 年 提出 了 DNA 双 螺 旋 分 子 结构 模型 ， 
解 开 了 遗传 信息 的 复制 和 编码 机 制 。 


而 现代 物理 学 中 ， 与 人 工 智能 可 能 最 密切 相关 的 是 量子 计算 。 从 机 制 
上 来 看 ， 量 子 比 特 的 量子 盖 加 态 特 性 ， 可 以 避 开 现 有 计算 机 发 展 中 摩尔 定 
律 的 限制 , 避免 现 有 CPU 发 热 问题 , 以 指数 级 的 效率 大 幅度 提升 计算 能 力 。 
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然而 ， 量 子 计 算 在 理想 情况 下 的 主要 优势 是 加 速 计算 。 但 速度 快 的 同时 ， 
它 也 为 每 个 量子 位 的 状态 引入 了 概率 或 不 确定 性 。 这 使 得 其 在 研究 人 工 智 
能 时 ， 有 可 能 失去 原本 机 器 学 习 很 容易 获得 的 精确 性 能 。 比 如 聚 类 中 最 经 
典 的 K- 均值 算法 , 经典 机 器 学 习 能 轻松 达到 的 性 能 ， 利 用 量子 计算 的 框架 
来 处 理 ， 可 能 效果 反而 会 变 得 不 尽 如 和 人意 。 另 外 ， 智 能 的 本 质问 题 应 该 不 
是 通过 提高 计算 效率 就 能 解决 。 

6. 遗传 学 

遗传 学 解释 了 基因 的 复制 、 交 叉 、 变 异 ， 近 年 来 在 基因 测序 方面 也 
取得 了 长 足 的 进步 。 从 已 知 的 情况 看 ， 基 因 的 结构 很 像 是 一 个 超 乎 寻常 
的 程序 员 编 制 的 程序 ， 固 定 的 基因 序列 中 包含 了 可 以 表达 功能 的 编码 区 和 
负责 多 个 其 他 能 力 如 调控 的 非 编码 区 。 不 仅 如 此 ， 基 因 似 乎 有 一 种 按时 表 
达 或 调控 的 能 力 。 这 种 编程 技巧 目前 还 无 法 在 人 类 已 有 的 程序 中 找到 对 
应 的 。 

不 仅 如 此 ， 目 前 对 于 分 析 非 编码 区 DNA 序列 还 没有 一 般 性 的 指导 方 
法 ,在 人 类 基因 组 中 , 并 非 所 有 的 序列 均 被 编码 , 即便 是 某 种 蛋白 质 的 模板 ， 
已 完成 编码 的 部 分 也 仅 占 人 类 基因 总 序列 的 3%~5%。 非 编码 区 的 调控 机 制 
人 类 还 远 没 到 能 百分之百 说 得 清楚 的 地 步 。 说 个 极端 的 例子 ,一 个 受精 卵 
分 裂 成 两 个 相同 的 ， 两 变 四 ,四 变 八 ， 以 此 类 推 ， 上 面 的 发 育成 了 大 脑 、 上 
身 ， 下 面 的 发 育成 了 脚 ， 可 是 这 种 细胞 与 细胞 间 的 方向 性 是 如 何 被 调控 机 
制 获 得 的 呢 ? 

所 以 ， 对 非 编码 区 按时 调控 的 深入 分 析 ， 也 许 对 于 理解 智能 体 的 结构 
发 育 有 着 重要 的 作用 。 正 如 1975 年 获得 诺 贝 尔 生理 学 或 医学 奖 的 美国 科学 
家 杜 尔 贝 科 (Dulbecco ) 于 1986 年 所 说 :“ 人 类 的 DNA 序列 是 人 类 的 真 说 ， 
这 个 世界 上 发 生 的 一 切 事情 ， 都 与 这 一 序列 息息相关 ”"。 但 要 完全 破译 
这 一 序列 以 及 相关 的 内 容 ， 我 们 还 有 很 长 的 路 要 走 。 
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7. 认 知 心理 学 

心理 学 中 与 智能 研究 相关 的 主要 是 认 知 心理 学 。 从 广义 来 讲 ， 与 人 认 
识 相关 的 都 是 认 知 心理 学 的 研究 范围 。 狭 义理 解 ， 主 要 是 信息 加 工 相 关 的 
心理 学 。 它 将 人 的 认 知 与 计算 机 类 比 看 待 , 希望 从 信息 的 接受 、 编码 、 处理、 
存储 、 检 索 的 角度 来 研究 人 的 感知 、 记 忆 、 控 制 和 反应 等 系统 。 

从 20 世纪 50 年 代 中 期 开始 ， 到 1967 年 美国 心理 学 家 奈 瑟 出 版 《 认 
知心 理学 》 一 书 形成 了 独立 的 流派 ， 至 今 已 有 近 70 年 的 历史 。 其 学 科 中 也 
衍生 了 强调 整体 大 于 部 分 的 格式 塔 心理 学 、 皮 亚 杰 的 结构 主义 等 众多 分 支 。 
因为 门派 众多 ， 这 里 仅 以 这 两 个 分 支 为 例 来 简要 讨论 在 人 工 智能 研究 中 的 
意义 和 存在 的 问题 。 

在 视觉 方面 ， 格 式 塔 心理 学 总 结 了 一 些 规律 ， 如 涌现 、 多 视角 、 聚 类 、 
旋转 不 变性 等 ， 强 调整 体 与 部 分 之 间 的 差异 ， 并 非 简单 的 累加 ， 甚 至 整体 
可 能 大 于 部 分 之 和 。 另 外 ， 顿 悟 学 习 、 学 习 迁 移 、 创 造 性 思维 的 研究 也 是 
其 重要 方向 之 一 。 其 不 足 在 于 ， 忽 视 了 对 生理 基础 的 研究 ， 部 分 实验 缺乏 
足够 的 证 据 。 另 外 ， 格 式 塔 理论 发 展 出 来 的 观点 不 太 容 易 量 化 、 程 序 化 。 
结果 ， 尽 管 大 家 觉得 它 有 一 定 的 道理 ， 但 近 几 十 年 在 计算 机 视觉 和 机 器 学 
习 研 究 领域 可 以 见 到 的 相关 论文 仍然 非常 少 。 

皮 亚 杰 倡导 的 儿童 发 育 心 理学 和 结构 主义 是 另 一 条 探索 智能 发 育 的 道 
理 ， 主 张 认 识 的 同化 和 顺应 ， 即 将 本 能 反应 向 不 同 目标 的 范围 扩大 的 同化 ， 
以 及 根据 环境 变化 而 对 行为 产生 改变 的 顺应 。 他 对 儿童 在 感觉 运算 、 前 
运算 和 具体 运算 阶段 的 观察 分 析 ， 视 角 非 常 独特 ， 也 开启 了 儿童 发 育 心 理 
研究 的 大 门 。 皮 亚 杰 的 结构 主义 不 足 在 于 : 四 受 研究 的 个 体 数量 和 年 龄 跨 
度 的 限制 ， 难 以 获得 更 一 般 性 的 归纳 总 结 ; @ 偏 好 用 问题 回答 的 方式 来 研 
究 , 难以 对 语言 未 完全 掌握 的 儿童 进行 有 质量 的 询问 。 而 且 , 如 我 之 前 所 述 ， 
问题 回答 本 已 是 高 层 和 抽象 智能 ， 远 离 了 智能 金字 塔 的 基础 。 
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如 果 可 以 多 审视 下 格式 塔 心理 学 和 皮 亚 杰 的 结构 主义 ,也许 对 于 我 们 
重新 思考 智能 体 的 发 育 ， 尤 其 是 理解 犯错 机 制 会 有 着 重要 的 启示 作用 。 男 
外 ， 也 许可 以 考虑 研究 宠物 的 认 知 心理 ， 尽 管 它 不 如 人 那么 聪明 ， 但 宠物 
狗 的 认 知 能 力 并 不 会 比 一 两 岁 小 孩 的 弱 多 少 ， 而 且 宠物 狗 的 一 生 是 长 时 间 
停留 在 与 儿童 相仿 的 认 知 能 力 下 的 。 

所 以 ， 尽 管 认 知 心理 学 可 以 利用 计算 机 模拟 人 的 抽象 思维 能 力 ， 但 在 
早期 发 育 和 金字 塔 结构 的 研究 这 一 块 还 存在 大 的 空间 有 待 挖掘。 

8. 社会 学 

在 未 来 ， 人工 智能 体 必然 是 以 群体 形式 来 存在 和 发 展 壮大 的 ， 所 以 有 
必要 研究 群体 行为 的 各 种 内 在 因素 。 与 这 一 问题 最 密切 相关 的 ， 是 研究 社 
会 行为 与 人 类 群体 的 社会 学 。 

自 1838 年 由 法 国 社会 学 创始 人 奥 古 斯 特 : 孔 德 首次 提出 “社会 学 ”的 
概念 ，19 世纪 40 年 代 由 埃 米尔 ROLY, BAR + 马克 思 、 马 克 斯 + 韦 
伯 三 大 社会 学 巨头 共同 创立 , 社会 学 至 今 已 经 形成 了 从 微观 的 社会 行动 和 
人 际 互动 ， 到 宏观 的 社会 系统 和 结构 的 广泛 研究 范围 。 在 群体 行为 的 结构 
功能 、 符 号 互动 、 社 会 冲突 、 社 会 交换 、 社 会 心理 、 社 会 统计 学 、 社 会 伦 
理 等 方面 ， 社 会 学 都 有 着 深入 而 丰富 的 研究 成 果 。 

尽管 如 此 ， 社 会 学 在 形式 化 这 些 成 果 方 面 还 存在 困难 ， 这 使 得 仿真 社 
会 学 中 的 群体 行为 各 要 素 有 一 定 难 度 。 而 如 果 和 希望 了 解 未 来 人 工 智 能 体 社 
会 的 各 种 变化 , 程序 化 这 些 要 素 又 是 必然 的 。 另 外 , 社会 学 关注 的 主要 是 人 。 
而 未 来 的 人 工 智 能 社会 组 成 肯定 不 限于 只 有 人 类 。 那 么 ， 如 果 要 提前 布局 
和 预测 ， 就 需要 将 非 人 类 智能 群体 行为 的 研究 也 纳入 智能 的 研究 范畴 中 。 

总 体 来 看 ， 研 究 人 工 智能 、 大 脑 的 功能 一 点 也 不 比 研究 宇宙 简单 。 从 
我 列举 的 、 并 不 算 完全 的 方向 来 看 ， 研 究 人 工 智能 的 相关 学 科 之 间 的 差异 
比较 大 。 研 究 机 器 学 习 的 ， 可 能 对 脑 科学 、 社 会 学 知之 甚 少 ， 研 究 脑 科 学 、 
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社会 学 又 对 机 器 学 习 的 核心 理论 与 算法 一 知 半 解 。 结 果 , 单 靠 一 臂 之 力 或 
一 个 方向 的 力量 ,孤立 开 来 各 自 做 研究 ， 可 能 就 只 能 盲人 摸 象 ， 看 到 局 部 ， 
却 依然 不 明智 能 路 在 何方 。 也 许 ， 打 破 彼此 间 的 骂 视 链 ， 交 又 合力 、 优 势 
互补 ， 或 许 能 找到 关于 智能 的 答案 。 
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附录 一 : 深度 学 习 ， 你 就 是 那 位 116 岁 的 长 寿 老 奶奶 ! 

2015 年 有 条 新 闻 ， 当 年 将 满 116 岁 的 纽约 布鲁克 林 老 太太 苏 珊 娜 。 马 
斯 哈 特 。 琼 斯 ( Susannah Mushatt Jones, 1899—2016 ) 接受 采访 。 记 者 问 
其 养生 之 道 ， 告 之 ， 每 天 早餐 吃 四 片 培根 9。 没 错 ， 就 是 “知识 就 是 力量 ， 
法 国 就 是 培根 ”里 的 培根 2。 

这 种 另类 的 长 寿 秘诀 在 百 岁 老 人 中 似乎 并 非 个 例 。 美 国 一 著名 的 搜索 
“ 令 人 惊奇 事件 ”的 网 站 曾 特地 搜罗 过 ， 比 如 百 岁 老 人 英国 人 多 葛 西 ， 豪 嘉 
好 金 铃 威士忌 和 每 天 抽 15 根 超级 帝王 香烟 ，1997 年 辞世 的 122 岁 老 人 让 
娜 :卡尔 芒 每 周 会 吃 近 1 千克 的 巧克力 号 ， 美国 沃 思 堡 的 104 岁 老 人 伊 丽 莎 
白沙 利文 喜欢 每 天 喝 三 瓶 “碳酸 ”饮料 , SES REHM 104 岁 的 特 雷 水 * 罗 
利 每 天 一 瓶 无 糖 可 乐 ，2014 年 台北 110 岁 的 老 太 太 林 黄玉 珍 特别 喜欢 喝 红 
i. WBA. 

为 什么 明明 不 符合 共识 的 养生 之 道 却 能 奏效 呢 ? 这 其 中 有 个 统计 上 的 
普 觉 。 共 识 的 养生 之 道 是 通过 归纳 的 方式 总 结 的 经 验 。 归 纳 是 由 一 系列 具 
体 的 事实 概括 出 一 般 原理 。 在 数学 上 ， 则 是 从 众多 个 别 的 事物 或 样本 中 概 
括 出 一 般 性 的 概念 、 原 则 或 结论 。 归 纳 追 求 的 是 统计 上 的 共性 、 平 均 ， 关 
心 的 也 不 是 个 例 上 的 特定 品质 。 既 然 是 共性 、 平 均 ， 它 自然 会 光滑 掉 某 些 


CD 琼斯 的 介绍 : https:/Wen.wikipedia.org/wiki/Susannah_ Mushatt Jones 

@ 名言 为 : Knowledge is Power. Francis Bacon. 弗 兰 西 斯 . 培根 是 17 世纪 英国 著名 哲学 家 、 
文学 家 等 。 
Q 虽然 卡尔 芒 是 近代 史上 最 年 长 者 吉 尼 斯 世界 纪录 保持 者 , 但 2018 年 11 月 和 2019 年 1 月 
有 俄罗斯 学 者 数学 家 尼 古 拉 。 札 克 (Nikolay Zak) 和 老人 学 专家 瓦 莱 里 。 诺 沃 萧 洛 夫 (Valeri 
Novosselov) 怀疑 其 身份 做 假 。 即 是 她 女儿 顶替 了 她 。 然 而 ， 此 怀疑 并 没有 得 到 确认 。 
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成 功 的 长 寿 个 例 的 品质 。 其 次 ， 在 统计 或 归纳 的 时 候 往往 是 基于 共同 的 结 
构 ， 而 不 会 过 多 地 考虑 甚至 会 忽略 个 体 间 差异 。 所 以 ， 如 果 过 分 地 相信 统 
计 和 归纳 ， 就 可 能 陷入 一 个 误区 ,会 认为 这 些 个 例 是 不 合理 的 。 

从 这 个 角度 看 ，2006 年 以 来 引发 第 三 波 人 工 智 能 热潮 的 深度 学 习 就 
像 是 那 位 116 岁 的 长 寿 老 奶奶 ， 而 深度 学 习 之 前 的 做 法 则 像 是 共识 的 养生 
之 道 。 

那么 以 前 的 “养生 之 道 ”是 怎么 玩 的 呢 ? 以 预测 任务 为 例 ， 我 们 的 目 
标 是 希望 学 习 到 的 模型 在 预测 未 知 目标 时 越 精确 越 好 。 但 放 在 统计 学 习 框 
架 下 ， 我 们 会 碰 到 模型 复杂 性 问题 。 这 一 问题 的 来 源 在 于 ， 设 计 的 每 个 模 
型 离 真实 的 模型 之 间 总 会 有 偏差 的 存在 ， 同 时 ， 模 型 的 参数 会 导致 其 模型 
自身 在 寻 优 时 存在 波动 ， 即 会 产生 方差 。 这 导致 我 们 要 处 理 的 问题 常常 
乏 唯 一 解 ， 是 病态 问题 。 因 此 ， 从 统计 意义 上 来 讲 ， 一 个 好 的 模型 需要 在 
偏差 和 方差 之 间 寻 找平 衡 ， 从 而 使 得 病态 问题 良 态 化 ， 如 附 图 1 所 示 。 在 
深度 学 习 未 包 打 天 下 之 前 的 年 代 ， 这 种 平衡 往往 是 通过 控制 模型 的 复杂 性 
来 获得 的 。 对 于 复杂 性 的 认识 ， 这 几 十 年 来 一 直 在 变迁 中 。 有 通过 控制 模 
型 的 参数 数量 来 实现 的 ， 如 贝 叶 斯 信息 准则 E, Akaike 信息 准则 (Akaike 
information criterion, AIC )  ; 有 从 信息 论 的 编码 长 度 角度 出 发 的 ， 如 
1978 年 乔 尔 玛 - 里 萨 南 (Jorma Rissanen ) 基于 Kolmogrov 复杂 度 022-121 HE 
出 的 最 小 描述 长 度 四 ， 克 里 斯 华 勒 斯 ( Chris Wallace ) 1968 年 提出 的 面 
向 聚 类 的 最 小 信息 长 度 呈 0 ; 有 从 数据 几何 结构 出 发 的 ， 如 限制 空间 光滑 
性 的 流 形 约束 07 ; 有 从 稀 玻 性 角度 出 发 的 ， 如 惩罚 模型 系数 总 量 的 工 1 范 
数 009, 还 有 从 模型 结构 的 推广 能 力 进行 惩罚 的 ， 如 统计 机 器 学 习 中 曾经 盛 
行 一 时 的 VC £i ( Vapnik-Chervonenkis dimension ) 0 最 大 边缘 等 约束 3。 

不 管 是 哪 种 复杂 性 ， 都 希望 是 在 统计 和 意义 下 ， 从 某 个 侧面 去 逼近 真实 
世界 的 局 部 甚至 整体 ， 获 得 在 其 假设 下 的 理论 最 优 解 。 因 为 是 归纳 求解 ， 
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解 通常 是 稳定 的 ， 不 会 出 现 多 少 异 类 。 


FE 
$* 
Bi: 
E 
a} 
r3 


附 图 1 经 典 的 最 优 模型 复杂 性 直观 解释 图 : 模型 越 复杂 ， 对 训练 数据 的 拟 合 越 好 ， 
如 偏差 的 平方 曲线 所 示 。 但 模型 的 稳定 性 会 变 差 ， 如 方差 曲线 所 示 。 所 以 ， 
最 优 模型 复杂 性 常 取 两 者 累积 的 折 中 


那么 ， 深 度 学 习 又 是 怎么 玩 的 呢 ? 不 管 采 用 什么 样 的 结构 ， 深 度 学 
习 最 明显 的 特点 就 是 模型 深 、 参数 多 。 自 2006 年 杰 弗 里 ， 欣 顿 ( Geoffrey 
Hinton ) 基于 伯 效 曼 机 提出 的 深度 模型 至 今 "，AlexNett 5 x a pep 090, 
Inception Px [1 、 稠 密 网 "5 等 各 种 深度 学 习 模型 的 可 调整 参数 的 数量 都 在 
百 万 级 甚至 百 万 级 的 百倍 以 上 。 这 带 来 一 个 好 处 ， 即 学 习 来 的 表示 能 张 成 
一 个 远大 于 原 有 空间 的 空间 ， 学 术 上 称 之 为 过 完备 空间 。 一 般 来 说 ， 在 这 
个 过 完备 空间 上 寻找 不 符合 统计 规律 ， 却 具有 优良 品质 的 个 例 的 机 会 就 显 
著 增 大 了 。 

那么 为 什么 以 前 不 做 呢 ? 一 方面 之 前 没有 那么 大 规模 的 数据 量 ， 另 一 
方面 以 前 的 工程 技术 也 不 支持 考虑 这 么 大 规模 的 模型 。 目 前 多 数 已 知 的 传 
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感 器 成 本 降 了 不 少 ， 各 种 类 型 的 数据 获取 成 本 也 下 降 了 ， 所 以 能 收集 到 PB 
级 甚至 ZB 级 的 数据 ， 如 图 像 、 语 音 、 文 本 等 。 实 在 找 不 到 数据 的 领域 ， 
还 可 以 通过 Q@ 2014 年 提出 的 生成 式 对 抗 网 络 趾 来 生成 足够 逼真 的 、 海 量 
的 大 数据 , @ 对 数据 进行 简单 处 理 , 如 图 像 的 旋转 、 放 缩 , 裁剪 来 扩充 数据 。 
这 些 处 理 都 使 得 训练 好 的 模型 在 刻画 这 个 过 完备 空间 的 能 力 上 增强 了 不 少 。 

其 次 ， 工 程 技 术 上 的 革新 也 推动 了 深度 学 习 的 成 功 。 深 度 学 习 的 前 身 
如 多 层 感 知 器 或 其 他 神经 网 络 模型 在 利用 经 典 的 反 向 传播 算法 调整 模型 的 
参数 时 ， 往 往 会 陷 和 人 局 部 极 小 、 过 度 拟 合 、 调 参 停 沾 的 梯度 消失 、 梯 度 爆 
炸 等 问题 ， 还 缺乏 处 理 大 规模 数据 需要 的 并 行 计算 能 力 。 这 些 问题 ， 在 近 
十 年 的 深度 学 习 发 展 中 或 多 或 少 都 得 到 了 部 分 解决 ， 比 如 通过 规 一 化 来 防 
止 梯度 消失 的 Batch Normalization ( 批 标准 化 ) 技术 ,考虑 增强 网 络 的 稳定 
性 、 对 网 络 层 进 行 百 分 比 随机 采样 的 Drop Out 技术 ( 即 每 次 网 络 中 有 部 分 
连接 边 不 参与 调整 ) "站 ， 还 有 数据 增 广 技术 等 。 这 使 得 深度 学 习 在 这 个 过 
完备 空间 搜索 具有 优良 品质 的 个 例 的 算 力 得 到 了 显著 增强 。 

那么 ， 能 和 否 找到 这 些 个 例 呢 ? 当然 可 以 。 现 有 的 GPU 显卡 提供 了 强大 
的 算 力 ， 而 并 行 和 分 布 式 计算 显著 提升 了 搜索 的 效率 。 因 此 ， 只 要 足够 耐 
心 和 具有 丰富 的 经 验 ， 在 模型 的 参数 空间 能 够 过 完备 的 超过 原 任 务 空间 的 
大 小 的 前 提 下 ， 总 有 办 法 通过 精细 调整 模型 的 参数 去 幸运 地 找到 这 些 个 例 ， 
而 且 这 些 个 例 显然 不 会 只 有 一 个 。 现 有 的 深度 学 习 在 软 硬 件 两 方面 都 可 以 
大 概率 保证 找到 一 群 “116 岁 的 长 寿 老奶奶 ”。 这 对 于 产业 界 来 说 ， 是 件 好 
事 。 因 为 产业 界 追 求 最 优 性 能 ， 而 非 统 计 意义 上 的 平均 性 能 。 而 且 ， 如 果 
数据 规模 足够 大 , 以 至 于 未 见 过 的 样本 又 很 少时 , 不 考虑 统计 上 的 “过 拟 合 ” 
问题 也 无 关 紧要 。 所 以 ,不管 你 是 白 猫 还 是 黑 猎 ， 只 要 能 捉 老 鼠 都 是 好 猫 。 
这 大 概 就 是 现在 深度 学 习 成 功 的 原因 之 一 。 

但 是 ， 有 得 必 有 失 。 既 然 寻找 的 是 个 例 ， 过 完备 空间 又 不 小 ， 寻 找 的 
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过 程 自 然 多 少 需要 点 运气 。 另 外 ， 它 也 不 是 纯粹 的 统计 或 归纳 ， 也 就 没 办 
法 形成 稳定 性 的 、 具 有 共识 的 “养生 之 道 ”, 甚至 从 中 归纳 出 一 套 类 似 于 “ 模 
型 复杂 性 ”的 合理 理论 都 有 可 能 难以 下 手 。 如 果 硬 要 找 的 话 ， 也 许可 以 考 
虑 一 下 墨 菲 定律 ( Morphs law ). 

所 以 ， 从 统计 角度 来 看 ， 尽 管 是 追求 共识 之 道 ， 但 统计 也 并 不 排斥 特 
例 的 存在 。 喜 欢 找 特例 的 ， 就 找 好 了 。 但 需要 注意 ,我 们 可 能 很 难 通过 这 
些 老 太太 的 比较 随机 的 “养生 之 道 ”"， 告 诉 人 工 智 能 研究 者 或 相关 领域 的 从 
业 人 员 比 较 普 适 性 的 准则 的 。 对 这 个 问题 的 思考 ， 也 引发 了 我 在 正文 第 21 
节 中 提出 的 “ 平 猫 不 确定 原理 ”。 
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附录 二 : 童话 ( 同化 ) 世界 的 人 工 智能 ” 

如 果 把 近年 来 人 工 智能 主流 技术 “深度 学 习 ” 理 解 为 那 位 116 岁 的 长 
寿 老 奶奶 ,那么 当前 人 工 智 能 的 诸多 现象 就 不 难 理解 了 。 概 言 之 ， 它 引发 
的 革命 、 对 行业 的 翻盘 和 对 学 术 圈 的 震荡 ， 还 有 隐患 和 不 足 都 是 那么 的 个 
性 鲜明 、 棱 角 分 明 。 

先 说 第 一 个 ， 革 命 。 端 到 端 (end-to-end ) 是 深度 学 习 面世 后 最 流行 
的 一 个 概念 。 以 前 我 们 做 研究 ， 都 喜欢 讲 要 深入 到 数据 内 部 去 ， 了 解 行业 
和 应 用 领域 的 特点 ， 然 后 才能 形成 好 的 交叉 学 科 成 果 。 以 计算 机 视觉 领域 
为 例 ， 在 计算 机 视觉 相关 的 任务 如 行人 跟踪 、 人 脸 识别 、 表 情 分 析 、 图 像 
检索 等 ， 共 识 的 观点 是 要 找到 最 富 代表 性 的 特征 ， 或 统计 性 的 或 结构 性 的 
或 变换 空间 的 。 这 些 特 征 对 后 期 的 预测 任务 至 关 重 要 ， 而 用 于 预测 的 模型 
则 另外 再 选择 或 设计 。 所 以 ,选择 特征 和 选择 预测 模型 之 前 是 两 套 基本 独 
立 的 班子 。 加 州 大 学 洛杉矶 分 校 的 朱 松 纯 教 授 以 中 药 抓 药 做 过 一 个 很 有 意 
思 的 比喻 。 在 童话 ( 同化 ) 世界 前 的 计算 机 视觉 领域 预测 模型 框架 里 ， 不 
同 的 药材 对 应 于 各 种 特征 ， 而 医生 对 应 于 特征 选择 器 。 者 药 用 的 药 饶 对 应 
于 模型 预测 器 。 当 性 能 还 不 太 好 时 ， 可 以 再 加 把 火 ， 即 集成 学 习 技术 ( 如 
Boosting ) 来 进一步 提高 预测 性 能 。 基 于 这 一 观点 , 他 和 画家 Kun Deng (XB 
EL, 音译 ) 于 2008 年 绘制 了 附 图 2°), 

深度 学 习 出 来 后 ， 很 大 程度 上 把 这 个 做 法 握 弃 了 ， 两 套 班 子 被 整合 了 。 


Q ”本 文 发 表 信 息 如 下 : KEP. 童话 ( 同化 ) 世界 的 人 工 智 能 加. 中 国 工业 与 应 用 数学 学 
会 通讯 ，2018, 4: 26-28. 
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我 们 治疗 所 有 疾病 。 


附 图 2 童话 (同化 ) 世界 前 的 计算 机 视觉 领 
域 预测 模型 框架 与 中 药 铺 的 类 比 OM 
( 感谢 朱 松 纯 教授 同意 使 用 此 画 ) 


特征 选择 到 预测 都 在 一 个 模子 
里 完成 ， 输 入 的 是 原始 数据 ， 
输出 的 是 结果 。 而 曾经 对 领域 
知识 的 依赖 被 隐 式 或 显 式 地 融 
入 了 模型 中 。 除 此 以 外 ， 依 赖 
于 强大 的 可 并 行 计 算 的 GPU 
的 算 力 ， 深 度 模型 的 预测 能 力 
也 大 为 提升 。 

于 是 ， 原 本 大 相 径 庭 的 
行业 都 走 到 了 一 起 ， 可 以 在 统 
一 的 模型 框架 讨论 人 工 智 能 在 


各 自 领 域 中 的 发 展 了 。 这 就 是 端 到 端 带 来 的 同化 现象 ， 因 为 它 将 曾经 对 行 
业 领 域 知识 的 依赖 性 或 准 入 门槛 显著 地 降低 了 ， 它 也 导致 越 来 越 多 的 行业 
因此 而 更 加 重视 人 工 智能 的 技术 研发 和 应 用 。 更 有 甚 者 ， 干 脆 把 依赖 手工 、 


简单 重 


a 重复 操作 的 岗位 直接 用 自动 化 和 人 工 智能 程度 高 的 机 器 替换 了 。 如 富 
士 康 公司 就 出 现 了 “熄灯 工厂 "。 因 为 这 些 工 作 不 再 需要 人 了 ， 那 灯 自 然 也 
不 是 必需 要 开 的 了 。 可 以 预见 , 未 来 这 种 情况 还 会 在 更 多 的 行业 漫延 ,那么 ， 
那些 从 事 简 单 、 重 复 操 作 工作 的 人 们 ， 有 没有 做 好 更 新 知识 寻找 新 工作 的 


准备 呢 ? 政府 又 有 没有 协助 做 好 相应 的 准备 呢 ? 
事实 上 ， 不仅 行业 间 的 同化 现象 比较 明显 ， 这 一 波 人 工 智能 热潮 在 
学 术 圈 也 有 类 似 的 同化 现象 。 近 几 年 在 人 工 智能 研究 上 ， 最 明显 的 特点 


就 是 顶级 人 工 智能 会 议论 文 数量 的 井喷 ， 


咱 大 国 的 论文 也 已 是 占 了 大 半壁 


江山 。 据 说 2019 年 人 工 智能 顶级 会 议 之 一 的 神经 信息 处 理会 议 (Neural 
Information Processing Systems, NIPS )， 光 投稿 量 就 达到 了 9800 篇 以 上 ， 
人 工 智能 顶级 会 议 AAAI 2018 年 论文 接收 1100 余 篇 ,计算 机 视觉 项 级 会 
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议 CVPR2018 论文 接收 1500 余 篇 ， 评 审 的 压力 可 想 而 知 。 仔 细 分 析 ， 原 因 
有 两 个 ， 一 个 是 端 到 端的 构造 方式 ， 使 得 大 量 的 预测 模型 模块 化 了 。 那 么 ， 
针对 不 同 的 任务 ， 在 模块 化 的 框架 下 ， 基 本 技巧 是 差不多 的 。 要 么 是 增加 
算 力 ， 比 如 多 买点 显卡 ; 要 么 是 增加 不 同 结构 的 模块 来 丰富 特征 的 多 样 性 ; 
要 么 是 改进 优化 技术 ， 来 寻找 更 多 更 强 的 长 寿 老奶奶 ; 要 么 是 增加 数据 量 ， 
或 虚拟 的 或 花 钱 买 的 ， 以 提高 逼近 待 搜索 最 优 解 空间 的 能 力 。 而 这 一 切 本 
应 高 大 上 的 技术 , 又 由 于 全 球 最 大 “同性 交友 网 站 ”Github 的 代码 共享 方式 ， 
进一步 变 得 简单 了 。 用 一 个 形象 的 比方 就 是 ， 原 本 小 学 得 用 算术 花 老 半天 
时 间 解 决 的 数学 习题 ， 上 中 学 后 发 现 用 代数 方法 就 能 很 轻松 解决 了 。 结 果 ， 
以 前 你 从 事 人 工 智 能 研究 ， 可 能 需要 打 个 好 几 年 扎实 的 数学 、 统 计 、 编 程 
基础 ， 现 在 因为 这 两 个 原因 而 变 得 简单 、 易 于 上 手 ， 也 方便 在 不 同 研究 领 
域 进行 推广 了 。 于 是 ， 人 工 智能 的 现状 就 变 为 : 老百姓 以 为 的 人 工 智 能 是 
正在 创造 一 个 又 一 个 复仇 联盟 者 3 的 英雄 ， 而 实际 当下 很 多 相关 的 研究 可 
能 更 像 是 穿着 不 同 衣服 、 梳 着 不 同 发 型 的 韩国 美女 。 

于 是 ， 曾 经 十 几 年 前 国人 鲜 能 发 表 论 文 的 人 工 智 能 顶级 会 议 ， 现 在 都 
能 见 到 本 科 生 一 次 发 很 多 篇 的 情况 了 。 除了 导师 指导 能 力 和 学 生 创新 能 力 确 
实 有 明显 增强 的 原因 外 , 在 一 定 程度 上 也 是 缘 于 近年 人 工 智能 快速 发 展 导 致 
的 知识 层面 上 的 拉平 效应 。 那 么 ， 在 这 种 形势 下 的 顶级 会 议 ， 是 否 还 有 必 
要 再 视 为 顶级 会 议 ? 不 妨 比较 一 下 物理 学 的 顶级 期 刊 Physical Review Letters 
( PRL,《 物 理 评论 快报 》)， 发 展 至 今 ， 有 没有 可 能 一 年 一 人 发 很 多 篇 文章 ? 

除了 两 个 同化 ， 深 度 学 习 对 预测 性 能 的 追求 也 存在 隐忧 ， 那 就 是 稳定 
性 和 可 解释 性 。 直 观 来 讲 ， 稳 定性 的 意思 是 ， 做 多 次 重复 性 实验 ， 应 该 保 
证 平均 的 性 能 尽 可 能 是 一 致 的 ， 模 型 性 能 的 波动 要 尽 可 能 小 。 从 预测 能 力 
来 讲 ,深度 学 习 模 型 预测 性 能 好 的 理论 保证 在 于 广义 到 近 定理 ， 只 要 耐心 ， 
总 可 以 找到 一 个 或 一 组 性 能 优异 的 结果 。 然 而 ， 如 果 深 度 学 习 找到 的 是 一 
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群 具有 鲜明 个 性 的 “长 寿 老奶奶 ”， 那 如 何 能 形成 很 好 的 稳定 性 呢 ? 何况 并 
不 是 每 次 都 能 找到 这 些 老奶奶 。 这 一 情况 通过 跟踪 相关 文献 能 看 出 些 端倪 。 
在 同化 世界 之 前 ， 多 数 文献 报道 实验 的 时 候 会 有 反映 一 致 性 的 均值 和 反映 
波动 的 标准 偏差 结果 ， 以 此 说 明 模 型 或 方法 的 稳定 性 。 而 近年 来 相关 的 不 
少 文献 在 这 方面 的 报道 比例 明显 少 了 不 少 。 是 因为 数据 规模 太 大 ， 算 力 再 
强 也 没 法 保证 计算 效率 吗 ? 我 想 这 里 面 多 少 还 是 有 统计 稳定 性 的 原因 。 

最 后 也 是 最 重要 的 ， 可 解释 性 。 举 例 来 说 ， 如 果 一 个 黑箱 形式 的 深度 
学 习 模型 通过 充分 的 训练 ， 在 预测 肺癌 的 能 力 上 被 证 明了 已 经 超过 专业 医 
生 的 水 平 ， 但 却 无 法 解释 其 如 何 形 成 判断 的 ， 那 么 应 该 没有 哪个 医院 敢 真 
正 使 用 这 个 模型 来 替代 医生 。 从 统计 上 来 看 ， 可 解释 性 是 力求 寻找 相同 概 
念 事物 的 共性 或 规律 ， 常 通过 归纳 总 结 获得 。 既 然 如 此 ， 那 对 模型 的 稳定 
性 就 得 有 高 的 期 望 。 然 而 ， 如 果 预 测 模型 追求 的 是 个 例 ， 那 就 可 能 难以 形 
成 稳定 的 、 有 效 的 可 解释 性 。 

在 物理 世界 的 量子 力学 中 ， 有 个 海 森 堡 不 确定 性 原理 ， 其 表明 微观 粒 
子 的 位 置 和 运动 不 可 同时 被 精确 测量 。 如 果 从 这 个 角度 来 审视 当下 的 人 工 
智能 ， 似 乎 可 以 推测 ， 预 测 性 能 和 可 解释 性 之 间 也 存在 这 种 不 确定 性 。 你 
如 果 和 希望 得 到 优异 的 预测 性 能 ， 可 能 就 得 牺牲 可 解释 性 。 因 为 前 者 是 可 以 
通过 个 例 体 现 ， 而 后 者 却 需要 从 统计 平均 出 发 。 反 之 亦 然 。 如 果 你 希望 在 
两 者 之 间 进 行 平衡 ， 那 也 许 就 需要 允许 机 咒 犯 点 错误 。 

其 实 ， 人 和 机 器 的 区 别 之 一 ， 不 就 是 人 会 经 常 犯 些 错误 吗 ? 自然 界 也 
是 如 此 。 所 以 ， 才 会 在 物种 的 发 展 和 延续 中 呈现 了 一 种 演化 现象 ， 并 非 一 
味 地 在 向 前 进化 。 所 谓 之 ,退步 原本 是 向 前 。 也 许 ， 童 话 ( 同化 ) 世界 后 
的 人 工 智能 ， 应 该 多 研究 下 会 犯错 误 的 机 器 或 模型 。 
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图 1.4 https://www.nydailynews.com/news/world/woman-sees-upside-article-1.1297128 
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upside-Rare-brain-condition-means-council-worker-sees-wrong-way-up.html 


2. 颠倒 的 视界 
图 2.1 http://paradisenewsblog.blogspot.com/2012/04/ilusao-de-otica-cerebro-vs-olhos. 
html 


图 2.2 FREIRE A, LEEO K, SYMONS L A. The face-inversion effect as a deficit in 
the encoding of configural information: direct evidence[J]. Perception, 2000, 
29(2):159-170. 

图 2.3 作者 本 人 照片 

图 2.4 http://brainden.com/jesus-illusions.htm (说 明 : 很 多 网 站 都 有 此 图 ， 不 清楚 源 
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3. 看 不 见 的 萨摩 耶 


图 3.1 


图 3.2 
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图 4.1 


图 4.2 
图 4.3 


图 4.4 


维基 百科 : https://zh.wikipedia.org/wiki/%E7%9C%BC#/media/File:Schematic_ 
diagram of the human eye zh-hans.svg 


作者 绘制 


见 的 斑点 狗 

https://www.moillusions.com/mysterious-dots-optical-illusion/ 来 源 说 明 : Gregory 
R (1970 "The intelligent eye” McGraw-Hill, New York ( Photographer: 
Ronald C James ) ; 本 照片 第 一 次 出 现 的 杂志 可 能 是 Life Magazine:58;7 1965- 
02-19, p120 

作者 拍摄 

(a) 维基 百科 : https://en.wikipedia.org/wiki/Rubin_vase#/media/File:Rubin2. 
jpg 

(b) 作者 绘制 

(c) 维基 百科 : https://en.wikipedia.org/wiki/Rabbit%E2%80%93duck_illusion#/ 
media/File:Kaninchen und Ente.svg 

桂林 九 马 画 山 : 

(a) 维基 百科 : https://zh.wikipedia.org/wiki/ 九 马 画 山 /media/File:JiuMaHuaShan. 
jpg 

(b) 维基 百科 : https:// en.wikipedia.org/wiki/’Oumuamua#/media/File:Artist%27s - 


impression 'Oumuamua.jpg 


5. 火星 人 脸 的 阴影 


图 5.1 


图 5.2 
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维基 百科 : https://en.wikipedia.org/wiki/Cydonia_ (region of Mars ) #/media/ 
File:Martian face viking cropped.jpg 或 https://science.nasa.gov/science-news/ 
science-at-nasa/2001/ast24may_1 

(a) 维基 百科 : https//upload.wikimedia.org/wikipedia/commons/2/2d/Viking - 
moc face 20m.gif 

( b ) https://mars.nesa.gov/resources/749 l/highest-resolution-view-of-face-on- 


mars/?site=insight 


图 5.4 
图 5.5 


图 5.6 


图 5.7 
图 5.8 


图 片 来 源 
ee 

( c) http://www.esa.int/Our_Activities/Space_Science/Mars_Express/Cydonia_-_ 
the face on Mars 
MAMASSIAN P, KNILL D C, KERSTEN D. The perception of cast shadows[J]. 
Trends in Cognitive Sciences, 1998, 2(8): 287-295. 
由 Yotube 视频 中 截取 的 4 帧 https://www.youtube.com/watch?v- WFK B9BxtZUs 
(a) PRATI A, MIKIC I, GRANA C, et al. Shadow detection algorithms for traffic 
flow analysis: A comparative study[C]. Proceeding of the 4th IEEE International 
Conference on Intelligent Transportation Systems, Oakland, CA, 2001, 8. 
(b) 维基 百科 : https://en.wikipedia.org/wiki/Counting_sheep#/media/File: 
Whitecliffs Sheep.jpg 
MAMASSIAN P, KNILL D C, KERSTEN D. The perception of cast shadows[J]. 
Trends in Cognitive Sciences, 1998, 2(8): 287-295. 
中 国 国家 航天 局 http://www.cnsa.gov.cn/n6759533/c6805086/content.html 
JACOBSON J, WERNER S. Why cast shadows are expendable: Insensitivity of 
human observers and the inherent ambiguity of cast shadows in pictorial art[J]. 


Perception, 2004, 33:1369-1383. 


6. 外 国 的 月 亮 比较 圆 


图 6.1 
图 6.2 


图 6.3 


图 6.4 


图 6.5 


维基 百科 : https://en.wikipedia.org/wiki/Moon illusion 

CHAN A B, LIANG Z-S, VASCONCELOS N. Privacy preserving crowd monitoring: 
counting people without people models or tracking[C]. IEEE Conference on 
Computer Vision and Pattern Recognition (CVPR), Anchorage, Alaska, USA, 
2008. 

ROSERBROCK A. Measuring size of objects in an image with OpenCV[OL].[2016- 
03-28]. https://www.pyimagesearch.com/2016/03/28/measuring-size-of-objects- 
in-an-image-with-opencv/. 

(a) https://www.mcescher.com/gallery/switzerland-belgium/still-life-and-street/ 
(b) https://www.mcescher.cony gallery/italian-period/hand-with-reflecting-sphere/ 
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7. 眼中 的 黎 曼 流 形 与 距离 错觉 


图 7.1 
图 7.2 


图 7.9 


图 7.10 


图 7.11 


作者 绘制 

维基 百科 : https://en.wikipedia.org/wiki/Gestalt_psychology#/media/ 
File:Invariance.jpg 

SEUNG H S, LEE D D. The manifold way of perception[J]. Science, 2000, 290 
(5500): 2268-2269. 

SEUNG H S. Learning continuous attractors in recurrent networks[C]. Advances 
in Neural Information Processing Systems 10, Denver, Colorado, USA, 1997. 
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清华 大 学 出 版 社 ，2006 : 270-301. 

(a) 维基 百科 : https://en.wikipedia.org/wiki/Swiss_roll#/media/File:RedVelvet. 
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(b) 作者 绘制 

TENENBAUM JB, VIN DE SILVA, LANGFORD J C. A global geometric 
framework for nonlinear dimensionality reduction[J]. Science, 2000, 290 (5500): 
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ROWEIS S T,SAUL L K. Nonlinear dimensionality reduction by locally linear 
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维基 百科 : https://en.wikipedia.org/wiki/Wormhole#/media/File: Wormhole-demo. 
png 
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8. 由 粗 到 细 、 大 范围 优先 的 视觉 


图 8.1 


图 8.2 
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韩 世 辉 , 陈 霖 . 整体 性 质 和 局 部 性 质 的 关系 一 一 大 范围 优先 性 T]. 心理 学 动 
Æ , 1996, 4(1):36-41. 

YANG G Z, HUANG T S. Human face detection in a complex background[J]. 
Pattern Recognition, 1994, 27(1): 53-63. 
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图 8.4 


图 8.5 


图 9.1 
图 9.2 


图 9.3 


图 片 来 源 
os 

(a) GONZALEZ R C, WOODS R E. Digital image processing[M].3rd ed. 北京 : 
电子 工业 出 版 社 2017. 
(b) LOWE D G. Distinctive image features from scale-invariant keypoints[J]. 
International Journal of Computer Vision, 2004, 60(2): 91-110. 
( c) BAY H, TUYTELAARS T, GOOL L V. SURF: Speeded up robust features[C ]. 
9th European Conference on Computer Vision (ECCV), Graz, Austria, 2006. 
(d) DENTON E, CHINTALA S, SZLAM A, et al. Deep generative image models 
using a Laplacian pyramid of adversarial networks (LAPGAN)[C]. Proceedings 
of the 28th International Conference on Neural Information Processing Systems, 
Montreal, Canada, 2014. 
(a) http;//www.123opticalillusions.com/pages/albert-einstein-marilyn-monroe. 
php 
(b) 作者 拍摄 
维基 百科 : https://zh.wikipedia.org/wiki/ 前 鲜 磨坊 的 舞会 


9. 抽象 的 颜色 与 高 层 认 知 


维基 百科 : https://zh.wikipedia.org/wiki/File:EM Spectrum Properties edit zh.svg 
维基 百科 : https://en.wikipedia.org/wiki/Sunlight#/media/File:Solar_spectrum_ 
en.svg 

(a): 作者 绘制 

(b ) HANLON M. A bees-eye view: How insects see flowers very differently to 
us[OL]. [2007-08-08]. https://www.dailymail.co.uk/sciencetech/article-473897/ 
A-bees-eye-view-How-insects-flowers-differently-us. html. 

维基 百科 : https://zh.wikipedia.org/wiki/ 加 色 法 #/media/File:Additive Color.svg 
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Color.svg 

维基 百科 : https://zh.wikipedia.org/wiki/ 口红 #/media/File:Lipsticks.jpg 
http://m.sohu.com/a/127725217_617877/2pvid=000115_3w_a#read 或 者 : https://www. 
reddit.com/r/pics/comments/gin4o/finish him/http://i.imgur.com/K5eBR jpg 
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图 9.9 维基 百科 : https://en.wikipedia.org/wiki/Color_blindness#/media/File:Color_ 
blindness.png 


10. 自 举 的 视觉 与 智能 

图 10.1 维基 百科 : https://de.wikipedia.org/wiki/Hieronymus Carl Friedrich von M%C3%B 
Cnchhausen#/media/File:M%C3%BCnchhausen-Sumpf-Hosemann.png 

图 10.2 https://www.writeups.org/tintin/ 

图 10.3 GONZALEZ R C, WOODS R E. Digital image processing[M].3rd ed. 北京 : 电 
子 工业 出 版 社 , 2017. 

图 10.4 GONZALEZ R C, WOODS R E. Digital image processing[M].3rd ed. 北京 : 电 
子 工业 出 版 社 , 2017. 

图 10.5 DEVLIN H. Operative dentistry: A practical guide to recent innovations[M].New 
York: Springer, 2006. 

图 10.6 (a) 维基 百科 : https://en.wikipedia.org/wiki/Checker_shadow_illusion 
(b) 作者 绘制 

图 10.7 维基 百科 : https://zh.wikipedia.org/wiki/ 蓝 黑 白金 裙 
原 图 来 源 : Katie Grant. The Dress: Roman Originals co-founder Peter Christodoulou 
on how viral image left company sitting pretty. The Independent. 2015-10-30. ( 原始 
内 容 存档 于 2018-05-21 ) 

图 10.8 https://m.sohu.com/n/481480832/ 或 http://pic.people.com.cn/NMediaFile/ 
2015/0407/MAIN201504071318000221499720492 jpg 

图 10.9 GOODFELLOW I J, SHLENS J, SZEGEDY C. Explaining and harnessing 
adversarial examples[OL]. arXiv: 1412.6572. 2015. 


11. 主观 时 间 与 运动 错觉 
图 11.1 Ca) 维基 百科 : https://en.wikipedia.org/wiki/File:Einstein_patentoffice.jpg 
(b) 维基 百科 : https://en.wikipedia.org/wiki/File:Albert Einstein Head.jpg 
图 11.2 http://zx.meilele.com/dengjw/article-22978.html 
图 11.3 作者 拍摄 
图 11.4 维基 百科 : https://en.wikipedia.org/wiki/Spinning Dancer https://upload.wikimedia. 


226 


org/wikipedia/commons/3/34/Spinning Dancer - Frames.png 

图 11.5 维基 百科 : https://en.wikipedia.org/wiki/Tllusory motion 
左上 https://en.wikipedia.org/wiki/File:Anomalous motion illusionl.svg 
右上 https://en.wikipedia.org/wiki/File:Kofe illuziya3.svg 
左下 https://en.wikipedia.org/wiki/File:Motion illusion in star arrangement.png 
右 下 https://en.wikipedia.org/wiki/File:Peripheral drift illusion rotating snakes. 
svg 

图 11.6 GONZALEZ R C, WOODS R E. Digital image processing[M].3rd ed. 北京 : 电 
子 工 业 出 版 社 2017. 

图 11.7 GONZALEZ R C, WOODS R E. Digital image processing[M].3rd ed. 北京 : 电 
子 工业 出 版 社 ,2017. 


12. 听觉 错觉 与 语音 、 歌 唱 的 智能 分 析 

图 12.1 https://kknews.cc/zh-sg/culture/5Sok9xbk.html 

图 12.2 ARSE Ft : https://en.wikipedia.org/wiki/Auditory_system#/media/File:Anatomy_ 
of the Human Ear.svg 

图 12.3 EPHRAT A, MOSSERI I, LANG O, et al. Looking to listen at the cocktail 
party: A speaker-independent audio-visual model for speech separation[J]. ACM 
Transactions on Graph, 2018, 37(4):112:1-112:11. 


13. 视听 错觉 与 无 限 音阶 中 的 拓扑 

图 13.1 KORDING K P, BEIERHOLM U, MA WJ, et al. Tenenbaum, Ladan Shams. Causal 
inference in multisensory perception[J]. PLOS, ONE, 2007, 2(9): e943. 

图 13.2 作者 绘制 

图 13.3 (a) https:/Avww.mcescher.conygallery/recognition-success/waterfall/ 
(b) https//www.mcescher.com/gallery/recognition-success/ascending-and-descending/ 
(c) https://www.mcescher.com/gallery/back-in-holland/reptiles/ 

图 13.4 维基 百科 : 北 卡 罗 林 那 历史 博物 馆 展 出 的 ，1938 年 理发 店 的 灯箱 https:/ 
en.Wikipedia.org/wiki/Barber%27s_pole#/media/File:Barberspole.jpg 
莫 比 乌 斯 的 打印 机 色 带 设计 https:/patentimages.storage.googleapis.comy/48/0d/ 
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a9/170fcc9360334e/US5062725.pdf 

图 13.5 (a) 作者 绘制 
(b) TYMOCZKO D. The geometry of musical chords[J]. Science, 2006, 
313(5783):72-74. 
(c ) https://www.mcescher.com/gallery/recognition-success/mobius-strip-ii/ 

图 13.6 (a) 维基 百科 : https://en.wikipedia.org/wiki/File:Klein_bottle.svg 
(b) CARLSSON G, ISHKHANOV T, VIN DE SILVA, et al. On the local behavior of 
spaces of natural images[J]. International Journal of Computer Vision, 2008, 
76(1): 1-12. 
(c) 维基 百科 : https://en.wikipedia.org/wiki/File:Acme_klein_bottle.jpg 

图 13.7 维基 百科 : https://upload.wikimedia.org/wikipedia/commons/c/c6/Simple_Torus. 
svg 

图 13.8 作者 绘制 

图 13.9 Youtube 的 Topology Joke 截图 : https://www.youtube.com/watch?v-9NlqYr6- 
TpA 

14. 我 思 故 我 在 

图 14.1 EHRSSON H H, HOLMES N P, PASSINGHAM R E. Touching a rubber hand: 
feeling of body ownership is associated with activity in multisensory brain 
areas[J]. Journal of Neuroscience, 2005, 25(45): 10564-10573. 


图 14.2 EHRSSON H H.The experimental induction of out-of-body experiences[J]. 
Science, 2007, 317(5841): 1048. 


15. 可 塑 与 多 义 


图 15.1 作者 绘制 
图 15.2 作者 绘制 
图 15.3 维基 百科 : https://zh.wikipedia.org/wiki/ 音乐 的 奉献 


16. 庄 周 梦 蝶 与 梦境 学 习 


图 16.1 作者 绘制 
图 16.2 维基 百科 : https://zh.wikipedia.org/wiki/ JE JE] & Hk #/media/File:Dschuang-Dsi- 
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Schmetterlingstraum-Zhuangzi-Butterfly-Dream.jpg 

图 16.3 维基 百科 : https://en.wikipedia.org/wiki/Brain_in_a_vat#/media/File:Braininvat. 
jpg 

17. 灵光 一 闪 与 认 知 错觉 

图 17.1 维基 百科 : https://en.wikipedia.org/wiki/Eureka_effect 


18. 情感 与 回忆 错觉 

图 18.1 维基 百科 : https://zh.wikipedia.org/wiki/ 罗 纳 德 ， 里 根 #/media/File:President_ 
Reagan_1985_ (cropped ) .jpg 

图 18.2 维基 百科 : https://zh.wikipedia.org/wiki/%E9I%AB%98%E9%8C%95#/media/ 
File:Charles K. Kao cropped 2.jpg 

到 18.3 维基 百科 : https://en.wikipedia.org/wiki/Senile_plaques#/media/File:Cerebral_ 


amyloid angiopathy -2a- amyloid beta - high mag.jpg 


19. 群体 的 情感 共鸣 : Al 写 歌 ， 抓 不 住 回 忆 
图 19.1 作者 拍摄 


20. 群体 智能 与 错觉 

图 20.1 维基 百科 : https://en.wikipedia.org/wiki/Swarm_behaviour#/media/File:Auklet_ 
flock Shumagins 1986.jpg 

图 20.2 维基 百科 : https://en.wikipedia.org/wiki/Army ant£/media/File;Flickr - ggallice - - 

Spoils of the raid.jpg 

图 20.3 维基 百科 : https://www.kvue.com/article/news/local/hang-out-with-austin-bats- 

saturday-at-2018-bat-fest/269-584369910 

图 20.4 作者 拍摄 

图 20.5 https://i0.wp.com/factrepublic.com/wp-content/uploads/2017/09/8.Ant-mill.jpg 

图 20.6 https://www.facebook.com/434161403310419/photos/a.730640946995795/97200 

4492859438/?type-3&theater 

图 20.7 维基 百科 : https://en.wikipedia.org/wiki/L%C3%A 9vy_flight#/media/File:Brownian- 


Motion.svg 
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图 20.8 维基 百科 : Levy flight: https://en.wikipedia.org/wiki/L%C3%A9vy_flight#/media/ 
File:LevyFlight.svg 

Kl 20.9 (a) 维基 百科 : https://en.wikipedia.org/wiki/Dardanus_pedunculatus#/media/ 
File:Dardanus_pedunculatus (Hermit crab).jpg 
(b) 维基 百科 : https://en.wikipedia.org/wiki/Remora#/media/File:Nurse_shark_ 
with remoras.jpg 


图 20.10 作者 绘制 


21. 平衡 : 机 器 vs 智能 

图 21.1 维基 百科 : https://en.wikipedia.org/wiki/Lotfi_A. Zadeh£/media/File:Zadeh, - 

L.A. 2005.jpg 

图 21.2 维基 百科 : https://en.wikipedia.org/wiki/Pyramid#/media/File:01_khafre_north. 
jpg 

图 21.3 维基 百科 : https://en.wikipedia.org/wiki/Turing_test#/media/File:Turing_test_ 
diagram.png 

图 21.4 http://hasansthoughts.blogspot.com/2011/10/john-searle-and-chinese-room-test. 
html 

图 21.5 维基 百科 : https://en.wikipedia.org/wiki/Schrédinger%27s_cat #/media/ 


File:Schrodingers cat.svg 

附录 一 

附 图 1 http://scott.fortmann-roe.com/docs/BiasVariance.html 

附录 二 

附 图 2 朱 松 纯 . Is vision a classification problem solvable by machine learning? [OL]. 
http://www.stat.ucla.edu/-sczhu/research blog.html. 
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图 片 版 权 声 明 


因为 时 间 、 精 力 和 网 络 条 件 所 限制 ， 我 们 无 法 核实 部 分 图 片 内 容 的 真 
实 性 ， 也 无 法 逐一 联系 图 片 的 著作 权 人 或 代理 人 。 如 有 对 这 些 图 片 主张 版 
权 者 ， 请 持 所 据 ， 联 系 清 华 大 学 出 版 社 版 权 部 或 本 书 的 责任 编辑 ， 我 们 将 
按 惯例 给 付 图 片 使 用 稿酬 。 

联系 电话 : 010-62770175 转 4119， 胡 老师 ， 邮 箱 418193990@qq.com。 

因为 网 络 图 片 质量 差别 极 大 ， 为 保证 能 准确 地 反映 所 描述 的 内 容 ， 出 
版 方 对 部 分 图 片 做 了 必要 的 技术 处 理 ， 特 此 一 并 说 明 并 致谢 。 
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